All Episodes

August 18, 2025 63 mins

Puntata speciale estiva con ospite Aniello De Santo, ricercatore di linguistica computazionale presso l'Università dello Utah. Parliamo con lui del suo campo di studi, di LLM e di ricerca negli Stati Uniti. Queste e molte altre le notizie tech commentate nella puntata di questa settimana.

Dallo studio distribuito di digitalia:Michele Di Maio, Francesco Facconi, Aniello De Santo

Produttori esecutivi:

Sponsor:Squarespace.com - utilizzate il codice coupon "DIGITALIA" per avere il 10% di sconto sul costo del primo acquisto.

Links:

Gingilli del giorno:

    Supporta Digitalia, diventa produttore esecutivo.

    Mark as Played
    Transcript

    Episode Transcript

    Available transcripts are automatically generated. Complete accuracy is not guaranteed.
    Speaker 1 (00:14):
    Dallo studio distribuito di Gump Media Production, notizie di tecnologia, questo è Digitalia.

    Francesco Facconi (00:29):
    Puntata speciale estiva di Digitalia nella quale parliamo con Agnello De Santo di Large Language Model, linguistica computazionale e di come funziona la ricerca su questi argomenti.
    In visita dall'Università dell'Iuta lo accogliamo per imparare insieme a voi qualcosa di più su questi temi sempre caldi nel nostro mondo digitaliano.
    Dallo studio di Milano Città Studi, Francesco Facconi.
    E dallo studio di Milano Isola Michele Di Maio.

    (00:58):
    Buonasera, buongiorno, buon tutto perché qua il tempo è fluido nel momento in cui ci ascoltiamo.
    Intanto ciao Michele.
    Ciao Francesco.
    So che non vedi l'ora di presentare questo nostro ospite che ha un cognome strano, cognome già sentito.

    Michele Di Maio (01:13):
    Ma è un caso, è un caso. Non è assolutamente collegato.

    Francesco Facconi (01:17):
    Non c'è nepotismo su Digitalia, non c'è...

    Michele Di Maio (01:22):
    Esatto. Va bene, allora ciao Aniello, Aniello De Santo.
    Ciao, che è figlio del nostro Cylon Prof e come il nostro Cylon Prof ha intrapreso la carriera accademica, quindi sono dieci anni, una decina d'anni che lavora nel settore della linguistica computazionale, come hai detto tu, nell'Università dello Utah.

    (01:50):
    parleremo appunto del tuo
    del tuo percorso
    e un po' di quello che fai
    ecco, ogni tanto qualcuno che davvero

    Francesco Facconi (01:59):
    ne sa ci vuole sempre

    Michele Di Maio (02:03):
    intanto come dobbiamo

    Francesco Facconi (02:04):
    riferirci a te? Perché abbiamo detto
    sei stato presentato come ingegnere
    ma hai detto no, linguista
    e quindi
    come ti consideri?

    Aniello De Santo (02:14):
    Chi sei?

    Francesco Facconi (02:16):
    Raccontaci brevissimamente

    Aniello De Santo (02:19):
    qualcosa
    Sì, io in realtà mi considero un linguista, ho iniziato da, in Italia ho fatto i studi di ingegneria informatica a Pavia.

    Michele Di Maio (02:29):
    Ok.

    Aniello De Santo (02:30):
    Che salutiamo, ciao Pavia.

    Michele Di Maio (02:31):
    Pavia ci ascolta sempre.
    Pavia ci ascolta sempre.

    Aniello De Santo (02:35):
    Però verso la fine della mia laurea magistrale, l'ingegneria, purché interessante, lasciava qualcosa, non so, di non corrisposto.

    Speaker 1 (02:49):
    Ok.

    Aniello De Santo (02:50):
    ed è capitato che a Pavia c'è un ottimo programma di linguistica teorica
    in particolare all'Oius Pavia c'è un professore di neurolinguistica Andrea Moro
    che studia come il cervello processa il linguaggio
    e io mi sono trovato a una delle sue lezioni e ho saltato un colpo di fulmine

    (03:11):
    per cui da lì ho deciso no io voglio studiare
    questo ovviamente magari non buttando i cinque anni di studi di informatica avevo fatto
    l'interesse era di usare
    aspetti matematici e computazionali
    ma per capire come il linguaggio umano funziona
    e da lì sono partito
    per gli Stati Uniti, ho fatto un dottorato in linguistica
    all'Astonie Brook University

    Speaker 1 (03:31):
    insomma hai unito le due cose

    Aniello De Santo (03:32):
    ho unito le due cose, però di sicuro come interessi
    mi considero un linguista
    non un ingegnere informatico
    va bene, è giusto, tenere le distanze

    Francesco Facconi (03:40):
    perdonatemi, sono una persona discretamente ignorante
    cosa fa un linguista?
    sei un ingegnere, scusa
    sono ingegnere quindi bravissimo
    cosa fa un linguista?
    perché può sembrare

    Aniello De Santo (03:51):
    i linguisti fanno tante cose in realtà
    è uno di quei settori che sono
    un po' in inglese direi moda
    umbrella term, scusate ogni tanto mi scappano
    degli inglesismi e di solito non parlano italiano

    Francesco Facconi (04:01):
    siamo milanesi quindi parliamo in termini
    english perché è molto cool fare così
    a Milano, tranquillo
    le call vanno così

    Aniello De Santo (04:08):
    bene
    il linguista è un settore gigante che può andare
    in generale lo studio del linguaggio
    umano, alcuni linguisti direbbero
    è lo studio scientifico del linguaggio umano
    ogni tanto questa cosa
    si porta un po' di supremazia
    delle scienze verso per cui io
    in realtà non lo amo come definizione
    anche se vuole

    (04:29):
    chiarire che in linguistica
    di solito non studiamo
    ti insegno l'inglese

    Speaker 1 (04:35):
    ti insegno il francese

    Aniello De Santo (04:36):
    ti insegno il cinese ma studiamo
    come funziona il linguaggio
    alcuni di noi lo studiano da un punto di vista sociale
    per cui come le nostre interazioni
    sono
    come le nostre interazioni
    usando l'italiano
    come abbiamo appena detto
    perché i milanesi usano un po' più di inglese

    (05:00):
    e altri studiano
    lo studiano dal punto di vista cognitivo
    che è la parte di cui io mi specializzo di più
    per cui cosa succede adesso nel nostro cervello
    nella nostra mente
    mentre stiamo parlando
    come che impariamo
    i bambini imparano il linguaggio
    molto rapidamente
    com'è che succede perché facciamo solo
    certi tipi di errori e non altri

    (05:20):
    e ovviamente queste due cose si intersecano
    uno può studiare dal punto di vista sociale
    come l'aspetto cognitivo
    può influenzare
    nelle prossime 5-6 ore

    Michele Di Maio (05:31):
    risponderai a tutte queste domande
    a tutti questi argomenti che hai aperto
    però tu parli di singolo linguaggio

    Speaker 1 (05:36):
    mentre invece

    Michele Di Maio (05:38):
    nel mondo ci sono n mili

    Speaker 1 (05:40):
    a linguaggi, come fai a fare

    Aniello De Santo (05:42):
    questo ombrellone

    Speaker 1 (05:44):
    tra tutti i linguaggi?

    Aniello De Santo (05:45):
    è per quello che usa la parola linguaggio invece che parola lingua
    quando dico linguaggio intendo appunto questa facoltà cognitiva
    che noi umani abbiamo di imparare le lingue
    così che se io prendo un bambino
    se io fossi nato in Italia da mio padre
    ma il primo anno di vita
    mi sposto a Tokyo
    avrei imparato il giapponese bene come avrei imparato l'italiano

    (06:08):
    non c'è niente di genetico del fatto di essere nato da un italiano
    che mi ha fatto imparare l'italiano

    Francesco Facconi (06:13):
    C'è qualcosa di cognitivo
    Il fatto che abbiamo pomodoro e mozzarella nel sangue
    Non c'entra niente con la lingua che parliamo
    No

    Aniello De Santo (06:20):
    Appunto questo poi dal punto di vista sociale
    Ci sono un sacco di studi a seconda di poi
    Come la cultura influenza il tipo di linguaggio che parliamo
    Ma siamo di sicuro predisposti
    Ad imparare le lingue
    Di imparare in modo particolare
    Molto rapidamente
    Già dal fatto che ad esempio
    Se tu ci pensi le nostre voci sono solo un tipo di rumore
    Ma il bambino

    (06:41):
    A un mese
    già impara a distinguere
    il ritmo della sua lingua madre
    rispetto al ritmo di un'altra lingua
    come fa a distinguerlo dai cani

    Speaker 1 (06:50):
    che abbaiano in sottofondo
    dal frigorifero

    Aniello De Santo (06:53):
    c'è qualcosa predisposto
    nel nostro cervello che ci fa
    imparare la lingua benissimo
    language machines

    Michele Di Maio (07:02):
    ok

    Aniello De Santo (07:04):
    per quello uso il linguaggio
    e poi ovviamente uno si può specializzare su
    come funziona l'inglese, come funziona l'italiano
    come funziona il giapponese
    a me in realtà appunto dal punto di vista cognitivo
    interessa cos'è che hanno in comune
    le nostre menti
    quando ascoltiamo
    l'inglese o l'italiano

    Francesco Facconi (07:21):
    che è ancora più affascinante da questo punto
    e il momento in cui
    qualcuno parla più lingue

    Speaker 1 (07:27):
    questa cosa chiaramente ha una differenza

    Francesco Facconi (07:30):
    immagino o no
    penso poi sia la lingua del tuo caso
    ipotetico nel quale ti sei trasferito da piccolo

    Speaker 1 (07:36):
    a Tokyo e quindi hai imparato il giapponese

    Francesco Facconi (07:38):
    in tenere età o magari il mio
    che adesso sto studiando il tedesco
    che chiaramente ha la veneranda età di qualche anno
    non è come averla imparata da bambino

    Aniello De Santo (07:48):
    no, infatti hai toccato queste cose
    che toccano un sacco di aspetti interessantissimi
    se ci sono differenze tra imparare più lingue quando siamo bambini
    e più lingue quando poi siamo adulti
    apprendimento di linguaggio da bambini
    apprendimento di linguaggio da adulti
    se lo fai a scuola con libri è molto diverso come approccio

    (08:09):
    per cui ci sono un sacco di studi
    un sacco di dibattiti molto accesi
    su quali sono le differenze
    se ci sono davvero differenze
    dal punto di vista cognitivo
    o è solo perché quando lo impariamo da adulti
    siamo un pochino
    più lenti a imparare le cose in genere
    per cui magari non ha nulla a che fare con il linguaggio
    specificamente, abbiamo anche meno tempo
    meno attenzione

    Francesco Facconi (08:33):
    sì, interessantissimo
    ti chiedo
    apro un momento forse un qualcosa di
    Poi magari torniamo sugli argomenti più...
    Chi impara a suonare uno strumento?
    La lingua della musica.

    Michele Di Maio (08:45):
    Eh no, esatto.

    Francesco Facconi (08:47):
    La chiamano la lingua della musica, ma dal tuo punto di vista di ricerca è vera questa affermazione o no?

    Aniello De Santo (08:55):
    Non sono un esperto in questa cosa, per cui una pura opinione.
    Anche di cui c'è un sacco di linguistica, una battuta tra linguisti è che se metti tre linguisti in una stanza
    non saremo mai d'accordo su nulla
    certo, quell'inside joke

    Michele Di Maio (09:12):
    inside joke tra linguisti

    Aniello De Santo (09:17):
    in realtà mi hanno regalato
    da pochissimo un libro che si chiama
    Language and Music

    Speaker 1 (09:21):
    in the Brain

    Aniello De Santo (09:23):
    di cui non mi ricordo l'autore
    anche se dovrei saperlo
    non ho ancora iniziato a leggere ma ci sono di sicuro
    degli aspetti cognitivi simili
    sia dal punto di vista di
    come percepiamo i suoni
    per cui quanta attenzione abbiamo
    predisposizione all'accento
    e predisposizione alla musica
    per esempio probabilmente sono correlati

    (09:44):
    e ci sono un sacco di studi dal punto di vista
    di se le strutture
    del linguaggio umano siano poi simili
    alle strutture
    di un pezzo complicato di Bach
    o di Mozart
    e si attivano aree del cervello simili o no
    il linguaggio tende ad attivare
    certe aree che non hanno a che fare
    con la musica ma altre aree che sono condivise

    (10:05):
    per cui la mia opinione è che
    non è esattamente come una lingua
    cognitivamente ma di sicuro
    sfrutta
    delle risorse cognitive simili
    ok
    ma quindi per dirla brutta

    Speaker 1 (10:19):
    tu la mattina vai in università

    Michele Di Maio (10:21):
    e metti i caschetti
    in testa alla gente per vedere
    che aree del cervello
    si attivano

    Aniello De Santo (10:28):
    se potessi
    durante il mio dottorato l'ho fatto
    una tecnica chiamata
    EEG

    Speaker 1 (10:36):
    C'è falogramma

    Aniello De Santo (10:38):
    Grazie
    Che è esattamente quella
    In cui uno viene nel laboratorio
    Tu gli metti del gel in testa
    Con gli elettrodi
    E li metti davanti a uno schermo
    Poverini per un'ora
    E gli fai leggere un sacco di cose
    Una parola alla volta
    Perché sbattere le ciglia
    Ogni tipo di movimento facciale

    (10:58):
    In realtà crea un sacco di rumore
    In questo tipo di registrazioni
    Per cui essere un soggetto
    Durante questi esperimenti
    è stancantissimo
    oggi
    uso più
    quello che
    uso esperimenti comportamentali
    di solito per cui

    Michele Di Maio (11:17):
    l'osservazione insomma

    Aniello De Santo (11:19):
    oppure ti metto comunque davanti a un computer
    ma magari registro quanto tempo ci metti
    a leggere una frase
    o strumenti
    di eye tracking per cui
    registro
    Quanto tempo i tuoi occhi si soffermano su una certa parola o su un'altra?
    Quanto tempo ci metti a rispondere a una domanda rispetto a certi tipi di frase?

    (11:44):
    Sono tecniche che sono molto buone per capire a livello generale
    cos'è che certi tipi di linguaggio fanno rispetto al tuo comportamento
    e sono più economiche.

    Michele Di Maio (12:00):
    Certamente, anche negli Stati Uniti.

    Aniello De Santo (12:02):
    Anche negli Stati Uniti.
    E soprattutto uno dei vantaggi che hanno è che non sono tecniche di laboratorio,
    per cui posso fartela fare.
    Potrei mandarti adesso un link di uno di questi esperimenti di cui sto raccogliendo dati
    e tu potresti farlo, magari non mentre parliamo, però mentre sei in bagno.
    Invece di doverti portare in laboratorio, chiuderti in una stanza per due ore.

    (12:25):
    O in bagno, chiudere in bagno in laboratorio.
    Esatto, però in bagno sai, la puoi scegliere tu invece in laboratorio.

    Francesco Facconi (12:29):
    Chiuderti in bagno per due ore può essere sempre interessante.
    Esatto.
    per la gioia di chi anche altro sia in casa
    tutto questo è veramente
    affascinante, so che però
    uno degli argomenti di cui possiamo
    riuscire a parlare, se è vero quello che

    Speaker 1 (12:46):
    ci è stato detto, è come tutto

    Francesco Facconi (12:49):
    questo e tutto quello che studi
    ha a che fare con un'altra cosa
    che ha a che fare con il linguaggio
    quindi oltre al linguaggio, la lingua della musica
    ha anche la lingua dei
    modelli di linguistica larga
    i large language model
    ha senso quello che ho detto?

    Aniello De Santo (13:04):
    cioè c'entra qualcosa?
    sì, quanto c'entri
    dipende da chi chiedi
    io di sicuro mi occupo perché appunto
    come dicevamo all'inizio
    quando ho intrapreso il mio viaggio da linguista
    non volevo buttare anni di esperienza
    come mi sono formato
    mi sono formato da linguista computazionale
    e infatti insieme a questi esperimenti

    (13:25):
    che faccio con noi di solito
    sviluppo modelli computazionali
    che mi aiutano a testare teorie del linguaggio
    magari a vedere quanti di questi dati
    riesco a predire con un certo tipo
    di modello. I modelli che uso io
    tendono a non essere
    del gruppo dei large language
    models, possiamo parlare
    del perché

    (13:46):
    decisamente sì
    però ovviamente
    come penso
    tutti sappiamo al giorno
    d'oggi è difficile lavorare
    penso in qualsiasi contesto ma di sicuro nel contesto
    di linguistica
    e scienze cognitive
    AI
    senza parlare di large language models
    per cui

    (14:08):
    sono i corsi che insegno
    e ne parliamo quasi sempre
    nel bene e nel male
    più nel bene o più nel male?
    ma io devo
    ammettere che
    sono
    un po' a metà
    ma tendo a preferire
    lo scetticismo rispetto a un sacco
    di questi

    (14:29):
    trend tecnologici per cui
    tendo a enfatizzare il male
    ma ovviamente sai

    Michele Di Maio (14:38):
    certo bisogna bilanciare

    Aniello De Santo (14:39):
    bisogna bilanciare tutto
    ci si prova almeno

    Michele Di Maio (14:43):
    esattamente
    però quindi
    le due cose secondo me possono essere
    collegate in due
    modi perché da una parte
    appunto
    gli LLM sono
    ok dietro hanno

    Speaker 1 (14:59):
    della matematica, diciamo così

    Michele Di Maio (15:02):
    ma l'interfaccia
    è linguistica
    e quindi c'è un ritorno
    di
    amore, di interesse

    Speaker 1 (15:11):
    sono anni in cui parliamo tutti STEM

    Michele Di Maio (15:13):
    STEM qua, STEM là
    improvvisamente che ci servono
    persone che sappiano scrivere
    anzi ancora più che sappiano scrivere
    perché sappia come funziona
    il linguaggio
    dall'altra parte un LLM
    può esserti anche utile a te
    in quanto ricercatore
    mi immagino, ci possono essere

    (15:34):
    delle applicazioni
    quale delle tue cose nel tuo campo
    almeno è più preponderante

    Aniello De Santo (15:40):
    quale applicazione funziona di più?
    secondo me entrambe
    in modo diverso
    hai ragionissimo che
    a parte l'interfaccia che al giorno
    d'oggi è sicuramente linguistica
    se uno prende chat GPT
    chiaramente ti ci devi interfacciare
    scrivendo o
    altri modelli forse parlando

    (16:01):
    ma dal punto di vista linguistico
    al cuore di questi modelli
    peraltro sono anche
    trained, addestrati su
    sul linguaggio umano
    su dati che sono puramente linguistici
    e infatti
    forse delle critiche
    che alcuni

    (16:22):
    AI skeptics
    al giorno oggi
    pongono rispetto a questi usi di modelli
    computazionali di questo tipo come
    modelli di intelligenza
    è che noi umani non ragioniamo solo
    con il linguaggio
    siamo contestualizzati in un mondo fisico
    visivo

    (16:43):
    tu dici abbiamo altri linguaggi

    Michele Di Maio (16:45):
    non verbali che interpretiamo

    Aniello De Santo (16:47):
    e anche nell'apprendimento del linguaggio
    in realtà sappiamo dal punto di vista di gente
    che studia l'apprendimento del linguaggio
    dei bambini
    quello che vedono rispetto alle tue espressioni facciali
    o le espressioni facciali dei genitori
    o il mondo che li circonda
    è importantissimo nel come poi apprendono il linguaggio

    (17:11):
    l'intonazione di come parli
    il contesto sociale e culturale
    sono cose che i bambini non imparnano il linguaggio solo
    sentendo frase dopo frase dopo frase
    che è come invece addestriamo questi modelli

    Speaker 1 (17:25):
    se no li metti davanti

    Aniello De Santo (17:26):
    anzi neanche davanti a una televisione

    Michele Di Maio (17:27):
    davanti a uno stereo e dici così
    imparate il linguaggio

    Aniello De Santo (17:31):
    esatto e non per dire che è solo l'aiuto visuale
    ovviamente importante
    i bomeni che hanno dei difetti visivi
    imparano lo stesso
    ma è il contesto di essere fisicamente
    nel mondo

    Francesco Facconi (17:42):
    il contenuto sensoriale probabilmente
    tutti gli altri sensi contribuiscono

    Aniello De Santo (17:46):
    che sia anche solamente l'affetto per i genitori

    Francesco Facconi (17:49):
    che comunicano il linguaggio inizialmente
    la lingua madre

    Aniello De Santo (17:52):
    chi te lo sta insegnando
    sempre delle mie colleghe all'università dello Utah
    hanno questa ricerca interessantissima
    di quello che sai
    di chi sta parlando
    se è per esempio un professore o un tuo collega
    o un tuo amico
    è importantissimo in quanta
    attenzione tu poni a quello che stanno
    tentando di insegnarti

    (18:12):
    e per cui tu impari un'altra lingua
    ad esempio da adulto
    la impari meglio se pensi a questa persona
    viene dal paese in cui si parla
    persona è un insegnante di quella lingua invece che
    questa persona è un adolescente
    che l'ha imparata online, anche
    se poi magari ti stanno insegnando esattamente
    la stessa cosa, per cui il contesto sociale
    in cui impariamo è importante

    Francesco Facconi (18:33):
    di nuovo nel bene e nel male
    l'autorità dell'insegnante dice anche

    Aniello De Santo (18:37):
    in un certo senso
    l'autorità o come dicevi tu il rapporto affettivo
    o qualsiasi cosa
    tu possa pensare dell'interlocutore
    e per cui
    questi modelli di linguaggio hanno comunque
    appunto sono addestrati
    hanno alla base queste architetture
    che in teoria possono funzionare con altri tipi di input

    (18:57):
    ma i modelli di cui sono famosi al giorno d'oggi
    sono addestrati su
    milioni e milioni e milioni e milioni
    di data
    scritto principalmente
    e per cui

    (19:18):
    c'è questo aspetto di
    cosa sappiamo di questi dati
    cosa sappiamo del linguaggio
    di come funziona
    che viene internalizzato
    da questi modelli che lo vogliamo
    non lo vogliamo
    e dall'altro lato così
    ti butto due cose rispetto alle due
    domande generali e poi decidiamo
    cosa ci interessa di più

    (19:38):
    dall'altro lato c'è ovviamente questa
    curiosità nel capire
    se questi modelli imparano
    il linguaggio, se lo stanno facendo
    sembra di sì
    se tu metti davanti
    qualcuno davanti a
    Coggt
    sembra che stia avendo una conversazione

    (19:58):
    possiamo parlare di cosa ne penso io
    però di sicuro l'impressione è quella
    e per cui uno dice ok se Coggt
    impara l'italiano, impara l'inglese
    può funzionare come modello
    cognitivo di come noi impariamo
    l'italiano, impariamo l'inglese oppure di
    come noi processiamo l'italiano
    per ora che stiamo parlando
    possiamo usare Coggt

    (20:18):
    o le architetture che sono alla base
    GPT-1, 2, 3
    possiamo usarle per studiare
    dal punto di vista cognitivo
    invece di fare un esperimento
    in laboratorio
    possiamo usare questi modelli per studiare
    quello che facciamo noi
    e dibattiti molto accesi
    io tendo ad essere
    nel campo della gente che pensa che dal punto di vista cognitivo

    (20:40):
    questi modelli non sono al momento
    particolarmente interessanti
    parzialmente perché
    chi? Vediamo l'input
    forse, vediamo
    l'output che è quello che ci scrivono
    ma le relazioni
    di casualità
    come siamo arrivati dal training data

    (21:02):
    dai dati su cui ti ho addestrato
    l'output a queste frasi che mi dai
    non è chiarissimo
    anzi sono delle grandi
    scatole nere, sono le gigantesche

    Michele Di Maio (21:12):
    scatole nere, esatto, noi le chiamiamo
    le reti neurali, poi vabbè anche nel nostro
    cervello non è che sia proprio facile guardarci
    dentro, no esatto

    Aniello De Santo (21:19):
    è complicatissimo infatti dal punto di vista
    umano come funziona
    il linguaggio sia cognitivo che neurale
    è ancora una grande domanda
    per fortuna perché così
    noi possiamo lavorarci
    ed è per quello che è un dibattito
    perché poi dipende un po' dal punto di vista
    filosofico se uno pensa
    ok posso capire

    (21:41):
    cose rispetto a una scatola nera
    che è
    l'aspetto cognitivo
    del linguaggio umano usando un'altra scatola
    nera che sono questi large language models
    oppure no, sono due scatole nere
    che sono interessanti da studiare
    magari sono correlate in qualche
    modo ma
    le devo studiare indipendentemente
    io sono al momento da questo secondo

    Michele Di Maio (22:03):
    ma in cui tu hai visto adesso
    chat GPT
    ci ha fatto conoscere al grande
    pubblico gli LLM
    oramai che sono 3 anni

    Speaker 1 (22:12):
    a fine 22 se non sbaglio
    a fine 21, vabbè siamo là

    Michele Di Maio (22:15):
    tu lavori nel campo da 10 anni
    si può dire che hai visto il prima
    e il dopo, quanto è cambiato
    il tuo lavoro e quanto è cambiato
    poi l'ambito di ricerca

    Aniello De Santo (22:27):
    negli ultimi anni
    questa è un'ottima domanda
    dato che io
    ho fatto
    questo sforzo molto cosciente
    quando ho iniziato di non
    etichettarmi come ah sei l'ingegnere che
    arriva a fare linguistica
    per cui soprattutto nella prima parte
    della mia carriera io mi sono più
    focalizzato

    (22:48):
    ho tentato di star via
    da queste tecniche che molto in generale
    uno chiamerebbe natural language processing
    o NLP
    e per cui
    molta della mia ricerca invece si è
    focalizzata su voglio usare modelli
    simbolici
    modelli che usano un sacco
    di matematica

    (23:10):
    esplicitamente
    non la matematica
    astratta
    astratta in un senso
    opaca di questi modelli
    di cui abbiamo
    strato dopo strato di funzioni
    matematiche, ogni funzione la capiamo
    in una neural network, ma
    una volta che ne metti

    (23:30):
    mille, una
    dopo l'altra, è quello che crea l'opacità
    il black box, che non è che non sappiamo
    cosa fa una
    funzione logaritmica, non sappiamo cosa
    fanno dieci funzioni logaritmiche una
    di seguito all'altra
    invece io uso modelli che si chiamano simbolici
    che sono più simili a quelli che si usavano
    negli anni 80
    in realtà per fare cose che oggi facciamo
    tipo l'EMS

    Francesco Facconi (23:52):
    la nostalgia è una brutta canaglia
    ricordiamolo
    l'intelligenza artificiale come lo interpretiamo oggi
    non è nata tre anni fa
    è tanto tempo

    Michele Di Maio (24:01):
    ricordiamo sempre che il tuo papà
    ha fatto la tesi di laurea
    sull'intelligenza artificiale
    ci tiene a ricordarci sempre

    Aniello De Santo (24:10):

    cioè
    negli anni 60
    ai Bell Labs dell'MIT
    si parlava in un certo senso
    in modo molto simile
    tra questi modelli che usiamo
    ora che sono modelli che
    al giorno d'oggi a Stanford
    non insegnano più
    perché

    (24:31):
    non funzionano bene come funziona
    un LLM
    ma negli anni 60 erano
    oh questi modelli tra 5 anni avranno risolto
    il problema del linguaggio
    qualsiasi cosa voglia dire risolvere
    il problema del linguaggio
    però c'è questo senso di
    i modelli computazionali
    risolveranno qualsiasi problema
    qualsiasi domanda scientifica

    (24:52):
    è sempre stata un po' in giro
    in questi approcci
    tecnologici
    alle domande di intelligenza artificiale
    rispetto a
    l'intelligenza artificiale in realtà
    è un settore interessantissimo perché appunto c'è l'aspetto
    tecnologico, l'aspetto delle scienze cognitive
    c'è l'aspetto della filosofia
    della sociologia, antropologia

    (25:15):
    che infatti manca un pochino
    quando andiamo poi a sentire
    solo i CEO delle grandi corporations
    di Facebook o OpenAI o Google

    Michele Di Maio (25:27):
    l'antropologia non ti fa fare profitti

    Aniello De Santo (25:30):
    esattamente
    e in realtà appunto anche dal punto di vista di formazione
    studiare ingegneria
    molte cose, no? È molto facile focalizzarsi
    a così tante cose da imparare
    nel mio settore, no?
    Se uno dice, però forse un po'

    (25:50):
    di filosofia della scienza dovresti studiarla
    se poi vuoi andare a fare queste cose.
    Ovviamente al momento ti viene a dire, ma perché
    io devo imparare a
    scrivere codice
    come se un dottore
    deve imparare a fare
    le strutture, quando è che ho il tempo
    di leggermi filosofia della scienza o sociologia
    o antropologia. Però poi ti trovi
    appunto con questa un po' di mancanza

    (26:12):
    di memoria storica
    il fatto che
    alcune di queste domande ce le avevamo
    80 anni fa

    Michele Di Maio (26:22):
    la tecnologia è cambiata

    Aniello De Santo (26:25):
    e come cambia la nostra
    reazione rispetto alla tecnologia
    e quindi
    tornando per esempio alla tua domanda di come cambia il mio lavoro
    giorno in giorno in realtà quello che è cambiato
    principalmente è un po'
    del fatto che
    più gente
    salmino questi termini principali
    o un modello di linguaggio

    (26:45):
    o intelligenza artificiale
    e
    è cambiato nel dover
    davvero leggere
    doversi tenere un po' aggiornati
    su queste cose che in realtà
    anche se io penso ad esempio che
    l'ultimo modello di CACPT
    non ci sta insegnando niente rispetto alle domande scientifiche
    che ho io
    è impossibile non tenersi aggiornati

    Speaker 1 (27:07):
    su cosa sta facendo

    Aniello De Santo (27:08):
    perché è così prevalente nel settore
    che è un po' irresponsabile poi non saperne

    Francesco Facconi (27:14):
    non so te Michele ma a me sapere che
    CiaGPT non sta rispondendo alle sue domande scientifiche
    mi tranquillizza

    Speaker 1 (27:20):
    mi dà la speranza che ci sia ancora qualcosa

    Francesco Facconi (27:22):
    che non abbiamo veramente raggiunto il soffitto
    ho toccato il fondo perché non ho idea di dove stiamo andando

    Michele Di Maio (27:28):
    serviamo a qualcosa prima che ci colleghino
    come batterie ai loro computer

    Francesco Facconi (27:34):
    dipende a chi chiedi ovviamente
    allora io vi prenderei
    un minuto, passerei la linea
    a Sanremo che c'è Franco che vuole assolutamente
    darci un messaggio e poi
    torniamo che ho un argomento di cui voglio parlare

    Franco Solerio (27:48):
    grazie Francesco
    solo un minuto per ringraziare
    il nostro sponsor, questa puntata
    è sponsorizzata da Squarespace
    la piattaforma all in one per creare
    pubblicare e far crescere la tua presenza online
    tutti abbiamo un amico
    o magari siamo noi, quell'amico
    che dice voglio lanciare una cosa nuova
    ci vorrebbe un sito, niente di complicato e lì comincia il dramma, scegliere la piattaforma,

    (28:10):
    installare plugin, trovare un tema che quasi ti piace, litigare con l'editor visuale,
    perdere un pomeriggio ad allineare due blocchi e poi magari il sito resta a metà, in bozza,
    per mesi. Perché? Perché mancano tempo, voglia, energia. Ma l'idea era buona, eh? Con Squarespace
    quella buona idea può diventare un sito vero, bello e online in pochissimo tempo. È tutto

    (28:32):
    integrato design dominio strumenti di pubblicazione e commerce newsletter prenotazioni tutto nello
    stesso posto il nuovo sistema blueprint ai ti aiuta a iniziare ti fa qualche domanda tipo che stile ti
    piace che contenuti vuoi mettere e in pochi clic ti propone una bozza su misura già pronta da
    personalizzare e niente panico si modifica tutto trascinando cliccando scrivendo niente codice

    (28:56):
    niente stress. Hai un servizio da offrire? Squarespace ti permette di ricevere pagamenti,
    gestire clienti, inviare fatture, il tutto con un look professionale. Se poi vuoi far crescere
    la tua community hai newsletter, analytics, SEO e contenuti a pagamento già inclusi. Tutto
    funziona, tutto è fluido e tutto è sempre aggiornato, sicuro e gestito. E se infine

    (29:18):
    tinkarti? E beh, c'è il supporto clienti, sempre disponibile, 24 ore su 24, 7 giorni
    su sette con persone vere che ti rispondono in fretta e che conoscono davvero la piattaforma
    perché non rispondono da un call center in giro per il mondo ma direttamente da un ufficio
    Squarespace. Vai su squarespace.com slash digitalia e inizia la tua trial gratuita. Non c'è bisogno
    di mettere nessuna carta di credito, nessun dato di pagamento perché la trial è gratis

    (29:42):
    sul serio. Quando finisce il tempo scade e non c'è nessunissimo addebito. Il giorno però che decidi
    utilizzarlo, che decidi di pubblicare
    e beh usa il codice coupon
    DIGITALIA che ti dà diritto
    allo sconto del 10%
    sul primo acquisto di un sito
    o di un dominio. Squarespace
    la differenza tra ci vorrebbe un sito

    (30:02):
    e vedere quel sito online
    in meno tempo di quanto pensavi.
    Grazie Squarespace per il supporto anche a questa
    puntata di DIGITALIA.

    Francesco Facconi (30:15):
    Rieccoci, grazie Franco,
    grazie al nostro sponsor
    e rieccoci con Agnello

    Speaker 1 (30:21):
    ciao a tutti

    Francesco Facconi (30:22):
    allora prima
    del blocco
    volevo chiederti
    un argomento di cui abbiamo parlato
    un paio di volte probabilmente leggendo
    degli articoli
    non sono sicuro capendoli alla perfezione
    per cui magari tu puoi aiutarci
    ricordo che un po' di anni fa
    o mesi ormai con la velocità

    (30:44):
    avevo letto come questi
    LLM ragionino tutti in inglese

    Speaker 1 (30:48):
    quindi traducano dall'italiano all'inglese

    Francesco Facconi (30:50):
    ragionino, creino la risposta
    e poi la ripropongano in italiano
    nel nostro caso, mentre di recente
    ho letto il contrario, che
    stanno iniziando a ragionare nelle lingue
    locali, come l'italiano
    in questo caso, visto che la maggioranza sono sviluppati
    in inglese
    e che questo fa sì che le risposte
    siano differenti

    (31:13):
    ok, ci sai aiutare
    Ha senso questa cosa dal tuo punto di vista?

    Aniello De Santo (31:19):
    Mi ha colpito?
    Allora, l'aspetto principale di questi modelli è su cosa li addestrano.
    Per cui quando prima si intendeva che la maggior parte di questi modelli che sono utilizzati in fase di produzione
    sono al loro cuore in inglese, è perché il tipo di dati, la quantità di dati di cui uno ha bisogno

    (31:45):
    rende praticamente
    qualsiasi altra lingua
    tranne l'inglese, quello che
    al giorno oggi chiameremo una low resource language
    una lingua in cui ci sono pochi dati
    che se ci pensi
    quando parliamo di dati parliamo di solito di dati scritti
    se ci pensi è un po' assurdo per noi
    pensare all'italiano è una lingua su cui ci sono pochi dati scritti
    abbiamo risorse scritte
    sull'italiano come le abbiamo su

    (32:07):
    centinaia di altre lingue
    per secoli
    secoli e secoli
    certo ma non possiamo fare

    Francesco Facconi (32:13):
    addestramento e training con Dante
    ad esempio perché se no parleremo tutti in terzine

    Aniello De Santo (32:18):
    esatto
    e soprattutto
    il problema principale è l'internet

    Speaker 1 (32:27):
    l'internet in inglese

    Aniello De Santo (32:29):
    la predominanza dell'inglese
    su qualsiasi sorsa
    del world wide web
    rende la quantità esatta
    di dati che generiamo ogni giorno
    in inglese, semplicemente non comparabile
    a quasi nessun'altra lingua
    quindi
    è solo

    Speaker 1 (32:49):
    una questione di dati che hanno permesso di addestrare

    Francesco Facconi (32:51):
    più che del
    come funziona la lingua nel quale
    fammi usare le virgolette
    l'LLM sta ragionando in quel momento

    Aniello De Santo (33:02):
    usiamo ragionare

    Francesco Facconi (33:04):
    tantissime virgolette

    Aniello De Santo (33:05):
    esatto, esatto, virgolettatissimo
    e non c'è una differenza
    nel senso che la lingua su cui
    addrestri il modello è la lingua
    che il modello usa
    per fare
    le sue inferenze eccetera eccetera
    almeno che tu non faccia
    quello che
    nel settore certe volte chiamano transfer learning

    (33:27):
    tu potresti dire oh io addestro un modello
    in inglese perché posso
    usare questi giga
    di risorse e poi faccio
    un po' di fine tuning su
    un dataset per esempio
    le leggi della corte europea
    perché ce li abbiamo sia in inglese
    in italiano esattamente gli stessi testi
    perché io posso usare un modello che ho addestrato
    in inglese e gli faccio

    (33:49):
    imparare la correlazione inglese
    italiano su
    testi correlati
    penso che quando ti riferivi
    a questi articoli dicevano ah questi
    modelli ragionano in inglese e poi l'interfaccia
    è in un'altra lingua sono modelli di questo
    tipo in cui
    il cuore del modello
    quello che davvero fa la maggior parte dei calcoli, diciamo,

    (34:16):
    è stata addestrata sull'inglese.

    Francesco Facconi (34:22):
    Quindi il ragionamento dovrebbe essere, sempre fra virgolette ragionamento chiaro,
    dovrebbe sempre essere lo stesso.

    Aniello De Santo (34:33):
    Sì, qui è dove l'opacità di questi modelli si introduce perché dipende da come fai questi step successivi, ci aggiungi un'altra lingua o puoi fare anche dei modelli che sono addestrati su più lingue allo stesso tempo e qui quanto dati in inglese gli è dato rispetto ai dati in italiano, rispetto ai dati in francese o in giapponese conta.

    (35:02):
    Soprattutto di quanto sono rappresentativi non solo di come funziona l'inglese,
    questo che fa funzionare questi modelli molto bene,
    questi dati sono rappresentativi di come funziona il mondo,
    di come parliamo di professioni lavorative, di come parliamo del tempo,
    di come parliamo di chi ha vinto il Festival di Sanremo.

    (35:24):
    Sono questi dati che sono nascosti in questo addestramento del modello.
    Al giorno d'oggi ci sono un sacco di ricercatori, molto più bravi di me, che hanno speso un sacco del loro tempo a dire come facciamo ad ottimizzare questo grosso problema.
    Diciamo che tu vuoi il GPT, ti piace come strumento, è un problema di accesso alle tecnologie, il fatto che lo puoi fare solo in inglese,

    Speaker 1 (35:53):
    o che ti serve una lingua su cui puoi fare addestramento

    Aniello De Santo (35:58):
    su trilioni di dati
    per cui c'è un sacco di gente
    al giorno d'oggi che invece si sta specializzando
    su come faccio ad avere modelli che funzionano in modo simile
    e che magari sono addestrati in modo simile
    ma che hanno bisogno di meno dati
    e questi sono modelli che potresti concepire
    sono addestrati solo in italiano
    ce ne sono vari in realtà che vengono da molti ottimi ricercatori italiani

    (36:25):
    e in questo senso potresti dire
    beh questo modello non ha inglese
    nessun
    nessun
    in nessun momento del suo addestramento
    se non che ci può essere dell'inglese
    nei dati italiani al giorno d'oggi

    Michele Di Maio (36:42):
    soprattutto quelli milanesi

    Aniello De Santo (36:44):
    o quelli miei
    e questo è un modello in questo senso
    che non ha ragionamento in inglese
    e poi quindi tornando alla tua domanda
    rispondono in modo diverso
    al 100% perché questi modelli rispondono
    secondo i dati
    su cui sono stati addestrati

    Francesco Facconi (37:03):
    estendo
    noi intelligenze
    non artificiali, detti anche esseri umani
    possiamo rispondere
    alla stessa domanda in modo diverso
    se siamo stati addestrati
    perdonami anche qua le virgolette
    in italiano o in inglese o in giapponese
    cioè dipende il nostro corpus linguistico
    a parità, lo so che è difficile

    Speaker 1 (37:23):
    la parità di tutto il resto

    Francesco Facconi (37:25):
    ci fa ragionare in modo diverso
    cioè il linguaggio
    genera di fatto
    quello che poi è

    Michele Di Maio (37:34):
    è la lingua che influenza il ragionamento
    e il ragionamento che influenza la lingua

    Speaker 1 (37:39):
    questa è una domanda bellissima

    Michele Di Maio (37:41):
    e mi stai mettendo

    Aniello De Santo (37:44):
    stai facendo tutte queste domande
    che sono esattamente le cose
    su cui combattiamo
    e su cui la gente ha opinioni molto forti
    la mia personale opinione è che certamente qualcosa del linguaggio influenza
    come pensiamo un pochino, come strutturiamo il pensiero
    per esempio l'italiano tende ad essere l'italiano che ci insegnano a scuola

    (38:06):
    quando impariamo a scrivere in italiano
    impariamo che in italiano si scrive con queste frasi molto lunghe, molto convolute
    per cui influenza un pochino il modo in cui poi impari a presentare
    stai facendo una lezione
    il modo in cui presento un argomento in italiano
    è un pochino diverso da come lo presento
    in inglese, non perché l'italiano
    e l'inglese sono fondamentalmente diversi

    (38:28):
    dal punto di vista cognitivo, ma perché si portano
    carico di tutte quelle altre sostituzioni
    sociali, di come
    parlo agli studenti
    di come parlo con voi, rispetto a come
    parlerei in inglese ai miei studenti
    e queste cose
    ci sono ovviamente nei testi scritti
    per cui quando destriamo questi modelli
    in italiano e in inglese

    (38:48):
    ci portiamo questi
    bias sociali in certo senso
    per cui gli italiani
    gli studenti italiani sono più formali degli studenti americani
    quando parlano con i loro professori
    per cui
    ha imparato ad essere formale
    non è che l'italiano
    è più formale
    è che le nostre strutture sociali
    che sono nascoste nel come usiamo l'italiano

    (39:09):
    sono un po' diverse
    e le statistiche
    del come usiamo il testo
    se lo portano dietro
    però se tu mi chiedi sai se abbiamo letto un libro
    dici che sono andato a vedere
    Superman non l'ho visto Superman quindi non chiedetemi
    però diciamo che siamo andati a vedere Superman
    e me lo chiedi tu in italiano come è Superman
    e qualcun altro poi domani me lo chiede
    un mio amico me lo scrive dall'America in inglese

    (39:30):
    la mia risposta come è Superman
    alla base non sarà diversa
    perché ho risposto in italiano e in inglese
    magari in inglese lo uso
    in modo un po' più informale in italiano
    uso parole un po' più elaborate
    ma il cuore della risposta è lo stesso

    Francesco Facconi (39:44):
    se ti è piaciuto se non ti è piaciuto

    Aniello De Santo (39:46):
    invece perché questi modelli
    sono addestrati su questi corpus
    queste strutture dati
    che possono essere completamente diverse
    è possibilissimo
    che ti rispondano due cose completamente diverse
    perché il modello non ti sta davvero
    e qui la gente
    si scanna

    Speaker 1 (40:03):
    sto per dire una cosa un po' forte

    Aniello De Santo (40:06):
    la mia opinione

    Michele Di Maio (40:07):
    quindi mettiamo un avviso agli ascoltatori

    Speaker 1 (40:10):
    Aniello sta per dire una cosa

    Michele Di Maio (40:11):
    attenzione potete andare avanti di 40 secondi

    Aniello De Santo (40:14):
    se non volete
    e non vi volete sconvolgere
    solo per
    i linguisti
    per dire per me
    il modello non sta ragionando
    sta trovando delle correlazioni statistiche
    tra il fatto che tu hai detto la parola Superman
    e la parola ti piace

    Speaker 1 (40:31):
    o like

    Aniello De Santo (40:32):
    e qualsiasi cosa avesse
    nel suo corpus di addestramento
    il pappagallo stocastico
    come direbbe Emily Bender
    esatto
    Per cui sì, infatti c'è questo dubbio che abbiamo,
    e che dato che noi in realtà questi modelli,
    a parte essere opachi nel senso che non li capiamo benissimo,

    (40:55):
    perché è molto difficile ricostruire questi step causali.
    C'è gente molto brava che sta lavorando esattamente
    a queste tecniche di interpretabilità causali.
    Perché mi sta dando questa risposta rispetto a questa domanda?
    L'altro problema è che noi non sappiamo su questi modelli
    su cosa sono addestrati,
    perché io non posso andare a prendere

    (41:16):
    il modello alla base di CACPT
    e guardare che dati ha.

    Francesco Facconi (41:19):
    Certo.

    Aniello De Santo (41:20):
    Anche perché molti sono piratati,
    quindi non vogliono che li guardano.
    Sono piratati, esatto.
    OpenAI al momento non rilascia
    neanche una descrizione dei dati,
    non è che te li fa vedere.
    Anche se te li facessi vedere sarebbe inutile
    perché sono comunque troppi,
    non è che tu puoi pagare uno
    a mettersi a leggere i dati.
    Certo.
    Figura di se si chiamava close AI.
    Esatto.

    (41:41):
    Beh, è qui che è il marketing.
    OpenAI è un'ottima
    idea
    nel punto di vista di vendere un prodotto
    perché ti fa pensare
    a cose che in realtà non fanno
    in ogni caso al momento non ti fanno neanche una descrizione
    del loro training set
    per cui noi sappiamo che sono
    per forza addestrati

    (42:03):
    sulla totalità
    che è l'internet perché
    su modelli più piccoli lo vediamo
    su modelli che possiamo usare col mio
    povero Mac Air che prova a fare
    quello che i server
    di OpenAI fanno
    però non è che possiamo andare a vedere
    cosa c'è nel modello di addestramento
    sappiamo anche che ad esempio

    (42:25):
    CACPT, quasi tutte queste
    LLAMS che hanno alla base
    queste architetture neurali
    poi hanno
    sopra di loro vari strati
    di fine tuning
    di solito fine tuning al giorno d'oggi
    è fatto con una tecnica che si chiama
    reinforcement learning with human in the loop
    che è praticamente addestramento
    rinforzato con

    (42:48):
    supervisione umana
    siamo diventati schiavi delle macchine

    Francesco Facconi (42:51):
    in un certo senso

    Aniello De Santo (42:53):

    qui di nuovo c'è l'aspetto di marketing
    che ci viene un po' nascosto il fatto
    che ci viene venduto
    come se questi modelli magicamente
    imparassero queste cose
    solo dai dati e poi
    veniamo a sapere che tutte queste compagnie
    pagano, non profondatamente
    purtroppo, pagano

    Michele Di Maio (43:13):
    vanno in Kenya a fare queste cose
    esattamente

    Aniello De Santo (43:17):
    ti pagano migliaia di jig workers
    in Kenya che sono chiusi
    dentro stanze 8 ore al giorno
    a leggersi il prompt
    di GCPT che i nostri
    che noi per scherzo
    mettiamo, fammi chiedere a GCPT
    cosa pensa nel tempo e c'è qualcuno
    poverino in Kenya che è lì a leggere
    a dare, ah questa è una risposta

    (43:37):
    adeguata la domanda o no?
    magari non lo fanno domanda per domanda
    non lo sappiamo, può essere

    Francesco Facconi (43:43):
    mi sento di colpo estremamente in colpa
    per quello che ho scritto
    di pieghe compagnia

    Michele Di Maio (43:48):
    meglio che andare in miniera però comunque

    Aniello De Santo (43:51):
    meglio che andare in miniera però

    Michele Di Maio (43:53):
    non l'ideale

    Aniello De Santo (43:55):
    non l'ideale e dal punto di vista
    tecnologico, a parte dal punto di vista sociale
    dal punto di vista
    tecnologico c'è questa
    confusione
    del fatto che ci
    ci viene venduta un po' di questa oggettività
    dell'algoritmo
    uno potrebbe anche essere critico indipendentemente

    (44:15):
    ma poi andiamo a sapere
    che questi algoritmi funzionano molto bene
    perché ci sono umani che
    usano le loro skill
    che prima sarebbero state usate
    per magari fare queste cose per cui
    il governo dà soldi ad OpenAI
    per invece fare da filtro
    al chatbot

    (44:37):
    abbiamo divocato un po'
    non mi ricordo
    come ci siamo arrivati qui
    però sì per cui sono queste cose
    molto complicate secondo me dal punto di vista
    sia tecnologico che sociale
    c'è una parte puramente tecnologica
    da scienziati a uno farebbe piacere
    poter pensare puramente alla tecnologia
    è una tecnologia interessante cosa fa
    però è impossibile

    (44:59):
    in un certo senso parlare
    di queste cose senza preoccuparsi
    dell'aspetto sociale dove prendiamo questi
    dati chi è che ci lavora dietro
    quali lavori vengono persi
    quando una compagnia ci vende
    un software dicendo che può fare
    certe cose anche se quel software non le può fare.
    Senza parlare dal punto di vista di
    energia, di

    (45:22):
    clima.

    Michele Di Maio (45:22):
    Di spreco dell'energia.
    Ascolta, noi adesso ti abbiamo fatto

    Speaker 1 (45:26):
    parlare un casino di LLM

    Michele Di Maio (45:28):
    anche se poi, hai detto,
    sei anche un po' freddito
    sul tema, ma in breve
    di cose poi al di fuori dagli LLM

    Speaker 1 (45:37):
    veramente fighe

    Michele Di Maio (45:38):
    qual è il fringe adesso nel tuo settore?

    Aniello De Santo (45:42):
    è un'ottima domanda
    guarda, secondo me
    il mio story
    di questo appunto
    in inglese è
    computational psycholinguistics
    possiamo usare modelli computazionali per studiare
    la parte psicologica del linguaggio
    secondo me è esattamente questa
    la tensione, per cui in realtà c'è
    questa domanda di

    (46:03):
    sono modelli cognitivi o no
    ok
    quindi stiamo imparando qualcosa
    quando li usiamo
    non per creare
    chatbots, queste tecnologie utili o non utili
    stiamo imparando qualcosa su di noi
    per cui se vai a una delle conferenze principali
    a cui vado io ogni anno
    che è la conferenza per lo human sentence processing

    (46:26):
    che appunto si occupa
    di come comprendiamo
    il linguaggio
    al livello della frase
    trovi un sacco di
    sottomissioni
    che sono
    transformer architecture
    ha fatto questo, si comporta
    come un umano
    e secondo me la tensione

    (46:47):
    nel settore è quella
    sicuramente è una domanda interessante
    cosa fa questa tecnologia
    è una domanda interessante dal punto di vista
    di quelli di noi che sono interessati
    a sapere cosa fanno gli umani
    per fare questo
    o no
    e
    that's the fringe
    lì che si combatte

    Michele Di Maio (47:08):
    ok ok

    Aniello De Santo (47:10):
    allora c'era l'altro

    Michele Di Maio (47:12):
    macro tema di cui
    volevamo parlare con te è un po'
    capire la tua esperienza
    invece di ricercatore italiano
    all'estero quindi
    perché l'Uluita
    come l'Uluita e soprattutto dove l'Uluita

    Aniello De Santo (47:26):
    dove l'Uluita è un'ottima domanda

    Michele Di Maio (47:29):
    ma guarda io in realtà

    Aniello De Santo (47:30):
    ho iniziato
    ho stato nel New York

    Speaker 1 (47:36):
    Upstate New York

    Aniello De Santo (47:38):
    Not Upstate in realtà

    Speaker 1 (47:39):
    L'università Long Island che è la stessa

    Aniello De Santo (47:42):
    isola dove è Brooklyn
    però dobbiamo essere molto attenti nel caso ci siano
    new yorkesi che ascoltano che non è parte di New York City
    assolutamente
    vicina abbastanza
    e sono finito lì
    perché volevo studiare linguistica
    e in Italia
    e in Europa più in generale
    è molto difficile fare un dottorato
    in un settore in cui non hai studiato prima

    (48:05):
    parte
    per la struttura
    dei nostri dottorati
    sono più corti di solito
    dei nostri dottorati italiani
    sono più corti di solito arrivi già con un progetto di ricerca specifico
    e dall'altro punto di vista che
    certe volte non puoi neanche far domanda
    almeno quando io
    mi stavo laureando, tipo io fare un master
    in linguistica
    ho professori che mi dicono no va benissimo

    (48:27):
    hai studiato da solo, hai recuperato
    certi buchi al tempo
    non puoi neanche far domanda perché non hai la laurea
    nel settore disciplinare giusto
    perché in un certo senso l'America era
    obbligatoria
    perché il loro modello di dottorato
    il loro modello accademico
    un po' più in generale

    (48:47):
    ci sono autostrade qui fuori
    sì le sentiamo

    Francesco Facconi (48:50):
    ambulanze

    Aniello De Santo (48:52):
    il modello universitario se non erro è meno

    Francesco Facconi (48:55):
    rigido rispetto a noi
    c'è più varietà che si può anche scegliere
    durante il percorso di studi

    Aniello De Santo (49:00):
    che è la parte in realtà
    che a livello di graduate studies
    per cui master e dottorato a me piace molto
    del modello americano
    questa idea di
    tu hai una base generale
    per esempio io ho studiato informatica
    per cui hai sicuramente dei buchi in altre cose
    però il dottorato ti dà il tempo
    di studiare anche
    sono più lunghi, durano almeno 5 anni

    (49:22):
    e i primi due anni sono praticamente
    solo di studio
    di studio e di ricerca
    e per cui io sono finito lì perché
    appunto volevo studiare linguistica
    volevo studiare linguistica in questo modo
    usando dal punto di vista umano
    perché non volevo andare lì a poi scrivere
    app per fare
    cioè GPT
    però volevo usare

    (49:43):
    questi skill di matematica
    di modellazione matematica che avevo imparato
    e c'era questo professore molto
    giovane all'Astonia Brook University
    che faceva Mathematical Linguistics
    qui usando algebra
    logica formale
    e ci siamo trovati
    ho fatto domanda
    per cui l'America era principalmente per quello

    (50:04):
    una volta che ho finito il dottorato
    ho deciso di
    adesso ormai cinque anni fa
    ho detto
    io vorrei tentare almeno di
    rimanere in università
    e in America funziona un pochino
    diversamente dall'Italia
    e che non puoi rimanere nell'università
    dove hai fatto il dottorato

    (50:27):
    anche se avessero una posizione
    nel tuo settore
    il mio dipartimento non assumeva nessuno
    nel mio settore, anche se l'avessero avuta
    non si fa
    neanche con
    quello che chiamiamo un postdoc

    Speaker 1 (50:40):
    che è molto raro, almeno nei settori in cui

    Aniello De Santo (50:43):
    computer science
    linguistica, psicologia
    l'idea è
    ai fini del dottorato vai da qualche altra parte

    Francesco Facconi (50:52):
    vai e diffondi
    immagino quello che hai imparato
    vai e diffondi
    esatto
    sì esatto

    Aniello De Santo (50:56):
    porti un po'
    sia
    quello che impari
    nel tuo dipartimento
    appunto
    approcci professionali
    approcci intellettuali
    è molto open

    Francesco Facconi (51:05):
    a differenza di qualche altro open
    di cui parlavamo prima
    questo approccio


    Aniello De Santo (51:09):
    e ovviamente
    hai i suoi pro
    e con
    uno degli svantaggi principali
    che ti forza davvero
    a dire
    vabbè io quindi vado
    dove c'è il lavoro
    tipo il mio anno
    professori
    aperte
    nella linguistica e computazione
    tipo in dipartimenti linguistica c'erano
    10 negli Stati Uniti
    fai domanda a tutti i 10

    Speaker 1 (51:30):
    dove vai?

    Aniello De Santo (51:31):
    dove ti assumono
    esatto
    prove con queste cose
    per cui poi nell'Odita ci sono finito così
    che è uno dei posti che mi hanno fatto un'offerta
    l'anno in cui mi sono indottorato
    e la loro offerta
    era la migliore
    che mi avevano fatto

    (51:51):
    in particolare è quello che gli Stati Uniti chiamano una tenure track
    per cui
    è un'università di ricerca
    principalmente, io faccio corsi
    ma la maggior parte delle mie valutazioni
    vengono da come pubblico o quanto pubblico
    e
    fondi adeguati per fare ricerca più o meno
    e soprattutto
    ha questa idea che ok hai 5 anni

    (52:12):
    6 anni e poi fai questa
    valutazione nazionale
    e ottieni il ruolo
    diciamo quello che sarebbe così
    Scusi siamo finiti così. Nello Utah che è molto
    ad ovest degli Stati Uniti
    e se pensate

    Francesco Facconi (52:25):
    di fianco alla California

    Aniello De Santo (52:27):
    c'è Nevada nel mezzo, a nord dei

    Francesco Facconi (52:29):
    grandi parchi

    Aniello De Santo (52:31):
    e a sud dei grandi, dipende
    a quali grandi parchi stai pensando, è a sud di Zion
    Zion è quello
    sopra, giusto giusto
    scusatemi, no, adesso gli americani
    è a sud di Yosemite

    Speaker 1 (52:43):
    nord di Zion

    Aniello De Santo (52:45):
    Zion è Nello Utah
    Per cui Salt Lake City
    Dove sono io è a North di Zion
    E i grandi parti sono un po'
    Tutti intorno
    È la regione dei grandi parchi
    È ad est di alcuni
    Grandi parchi, quelli famosi californiani

    Speaker 1 (53:02):
    Se puoi

    Aniello De Santo (53:03):
    Esatto

    Speaker 1 (53:05):
    Stai elencandomi questo
    È facile così

    Aniello De Santo (53:10):
    Però se tu ti immagini
    San Francisco
    Se da San Francisco guidi in una linea dritta
    Verso est

    Speaker 1 (53:16):
    arrivi a Salt Lake City ma devi passare

    Aniello De Santo (53:19):
    per il Nevada

    Michele Di Maio (53:21):
    che è dove è Las Vegas

    Aniello De Santo (53:24):
    è bello

    Michele Di Maio (53:25):
    ce lo consigli una vacanza
    come vacanza ve lo consiglio di sicuro
    se vi piace la natura

    Aniello De Santo (53:31):
    se vi piacciono i grandi parchi
    lo Utah e quella regione lì in realtà
    sono unici da quel punto di vista
    perché ce ne sono davvero tantissimi
    sono spettacolari
    è una strada di bassa popolazione
    bassa densità
    esatto
    e si alterna tra dove sono io
    io sono in alta montagna

    (53:52):
    però appena scina

    Speaker 1 (53:55):
    si scia benissimo
    siamo vicinissimi alle montagne

    Aniello De Santo (53:58):
    tipo dal mio ufficio sciare no

    Michele Di Maio (54:01):
    quindi come Avellino

    Aniello De Santo (54:03):
    mi sembra di notare
    una certa

    Michele Di Maio (54:07):
    continuità
    come Monticchio
    come battuta

    Aniello De Santo (54:12):
    te ne sei dovuto andare
    negli Stati Uniti per finire ad Avellino
    va bene va bene

    Michele Di Maio (54:18):
    ma è così
    tornare?
    ci torneresti? vorresti?

    Aniello De Santo (54:24):
    ma guarda
    sono difficili
    la ricerca americana
    ormai sono in America da tanti anni
    per cui anche solo il fatto di pensare
    spesso 10 anni in un paese
    ci vuole tempo ad abituarsi
    culturalmente a essere
    in un altro posto

    (54:46):
    ritornare
    un passo impegnativo è ritornare
    alla fine in un tipo di
    struttura accademica a cui non sono più abituato
    perché io non ho fatto
    dal punto di vista di ricerca non ho fatto nessuna
    scusatemi
    non ho fatto nessuna delle mie
    componenti educative di ricerca

    (55:06):
    avere in Italia

    Speaker 1 (55:08):
    il dottorato l'ho fatto all'estero

    Aniello De Santo (55:10):
    ho lavorato come professore all'estero
    ci sono alcuni
    modelli di come funziona l'università italiana
    a cui non sono proprio abituato

    Michele Di Maio (55:20):
    infatti tu non hai mai fatto ricerca in Italia
    non ho mai fatto ricerca in Italia

    Aniello De Santo (55:23):
    che infatti è un po' buffo
    perché quando incontro certe volte
    ricercatori italiani all'estero
    finiamo ogni tanto a parlare
    di ricerca italiana
    io non so neanche i nomi certe volte
    o come prima dicevo
    scusatemi gli inglesismi
    perché non sono abituato
    a parlare di queste cose in italiano
    perché non le ho mai studiate in italiano
    e per cui non mi manca la terminologia

    Michele Di Maio (55:45):
    che è una cosa un po' imbarazzante

    Aniello De Santo (55:47):
    certe volte perché di nuovo vuoi spiegare
    o vuoi parlare con colleghi italiani
    che ovviamente la sanno sia in italiano che in inglese
    e gli devi dire
    no io devo parlarne in inglese di questa cosa
    ma non perché voglio parlarne in inglese
    ma perché

    Michele Di Maio (55:58):
    no ma guarda ci capita la stessa cosa su Digitalia

    Speaker 1 (56:01):
    che noi leggendo tante cose in inglese

    Michele Di Maio (56:02):
    ci sono certi argomenti che noi li abbiamo sempre
    approcciati passivamente in inglese
    e poi siamo qua a parlarcene tra italiani

    Francesco Facconi (56:09):
    in italiano e quindi dobbiamo
    e non ci siamo mai mossi da qui
    esatto, ogni tanto qualche

    Michele Di Maio (56:16):
    ascoltatore ci bastona
    ma è difficile

    Aniello De Santo (56:19):
    mia mamma mi bastona

    Michele Di Maio (56:21):
    e c'ha ragione

    Aniello De Santo (56:24):
    però appunto
    dal punto di vista linguistico è un po' difficile
    fare questo tipo di passaggi
    quando non hai il lessico giusto

    Michele Di Maio (56:32):
    come dicevi
    poi se non li sai fare tu che sei linguista
    è imbarazzante anche

    Aniello De Santo (56:38):
    però tornare
    sì appunto è complicata
    e fino a un paio di anni fa ti avrei detto
    guarda io in America sto bene
    mi mancano ovviamente certe cose dell'Italia
    sia culturali
    che di vita quotidiana
    però in America sto bene
    dal giorno d'oggi
    l'America è un posto complicato in cui vivere
    e far ricerca in America

    (56:59):
    è un po' un'incognita
    come dicevo prima al momento ho fondi di ricerca
    li avrò tra un anno e mezzo
    non è chiaro
    indipendentemente dalle mie abilità
    di avere fondamentale

    Francesco Facconi (57:16):
    stiamo intuendo ma lasciamo la
    sospesa

    Michele Di Maio (57:19):
    la sfumiamo per la puntata
    fra due anni dove ci racconterai

    Aniello De Santo (57:23):
    però è una cosa secondo me
    che si può dire
    è che al momento in America
    quello su cui fai ricerca
    conta se puoi far ricerca o no
    indipendente da quanto sia bravo
    quanto sia un tema interessante
    io ho colleghi

    (57:44):
    che da un giorno all'altro
    hanno scoperto che non potevano
    più far ricerca nel senso
    gli hanno chiuso il rubinetto
    esatto, cosa vuol dire non poter fare ricerca?
    ovviamente tu puoi fare che vuoi

    Speaker 1 (57:55):
    però ti ti dai soldi

    Aniello De Santo (57:58):
    o se sei un ricercatore estero
    puoi pubblicare su quelle cose
    un visto
    o passare la frontiera
    non è chiaro
    secondo me è una cosa buona da sapersi
    in Italia
    al di là di quello che i giornali
    dicono o non dicono

    Francesco Facconi (58:14):
    la ricerca scientifica per uno stato è assolutamente l'ultima

    Aniello De Santo (58:17):
    delle cose, non serve assolutamente

    Francesco Facconi (58:19):
    lo ricordiamo e quindi

    Aniello De Santo (58:21):
    l'America non ne ha beneficiato
    per nulla

    Francesco Facconi (58:25):
    non hanno attirato ai tempi
    in altri tempi un sacco di ricercatori
    e forse è la volta buona che
    anche tu dicevi che c'è
    in Italia

    Speaker 1 (58:35):
    e in Europa uno stile diverso

    Francesco Facconi (58:37):
    probabilmente ci sono anche meno fondi
    e questo è quello che tutti gli amici ricercatori

    Speaker 1 (58:40):
    che ho dicono

    Francesco Facconi (58:42):
    però può anche essere il momento in cui

    Aniello De Santo (58:44):
    come Europa ci si interroga

    Francesco Facconi (58:46):
    sull'opportunità

    Aniello De Santo (58:47):
    e infatti ci sono tanti stati
    la Francia ad esempio ha iniziato un'iniziativa
    giusto quest'anno
    un pilot study con l'università di Marsella
    dicendo ai ricercatori americani
    venite, fate domanda
    un concorso
    vi diamo fondi più di quelli
    che daremmo a un ricercatore
    francese di base, di nuovo, queste sono cose
    complicate dal punto di vista sociale

    (59:08):
    perché se fossi poi un ricercatore in Francia direi
    ok però
    però dal punto di vista di attrazione
    di tutta questa gente che se n'è andata
    perché in America ci pagano
    tre volte tanto
    e ci hanno fondi di ricerca
    che sono non comparabili
    a quelli che i miei colleghi hanno in Italia
    ci siamo andati per quello

    (59:32):
    diciamolo che siete andati per quello

    Francesco Facconi (59:34):
    e speriamo che qualcuno ascolti
    lo so che è ovvia questa cosa
    ma diciamola

    Aniello De Santo (59:39):
    comunque sì, complicato

    Francesco Facconi (59:42):
    va bene Agnello
    io intanto ti ringrazio, è stato veramente

    Aniello De Santo (59:46):
    interessante

    Francesco Facconi (59:47):
    questa oretta di chiacchierata
    vorrei andare avanti

    Speaker 1 (59:51):
    personalmente ancora, però secondo me a un certo punto

    Francesco Facconi (59:53):
    bisogna avere il coraggio di mettere un

    Speaker 1 (59:55):
    punto e virgola, magari ricominciamo

    Francesco Facconi (59:57):
    un'altra volta
    e ti chiederei se hai qualche
    consiglio, qualche
    suggerimento di
    lettura

    Michele Di Maio (01:00:07):
    visto poi tuo padre che consiglia
    solo libri, quindi ci aspettiamo

    Aniello De Santo (01:00:11):
    una serie tv, no scherzo
    oh magari, lo dovevi dire
    prima mi sarei preparato una serie tv da suggerire
    ma guarda in realtà
    se vi posso suggerire due cose
    mi suggerisco un anime
    si chiama
    che è piuttosto vecchio in realtà

    (01:00:34):
    però fa domande rispetto al nostro aspetto cognitivo
    chi siamo come una mente e l'interfaccia digitale

    Speaker 1 (01:00:45):
    molto strano, qui siete preparati

    Aniello De Santo (01:00:48):
    e poi dato che dicevi libri
    c'è
    questo
    ci sono un paio di libri in realtà
    che non ho ancora letto ma che sono
    on top of my stack

    Speaker 1 (01:01:02):
    pronti sul comodino

    Aniello De Santo (01:01:03):
    uno si chiama The AI Con
    è di Emily Bender

    Speaker 1 (01:01:07):
    che abbiamo citato prima per

    Aniello De Santo (01:01:09):
    Casi Pirate e Alex Hanna
    che è un
    sociologist incredibile
    che parla
    di questo
    tecnologie LLMs
    da un punto di vista di hype
    e cosa ci dicono, cosa ci vendono
    e quanto questo ha a che fare con questo
    che questi modelli possono fare davvero
    e l'altro libro si chiama Why We Fear AI

    (01:01:32):
    by
    Hagen Blix e
    Ingeborg Glimmer
    che prende
    un approccio un po' diverso
    dal punto di vista economico-sociale
    di cosa stanno facendo queste tecnologie
    al mercato del lavoro
    ci aiuta questa prospettiva
    a rispondere domande del tipo

    (01:01:53):
    può C.A.G.P.T. fare questa cosa o no
    entrambi sembrano molto interessanti
    dagli estratti che ho letto
    non li ho finiti
    per cui se li leggete e li odiate
    non è colpa mia
    va bene

    Francesco Facconi (01:02:06):
    fantastico
    di tradizione mettiamo il gezzino
    vuol dire che è il momento di chiudere
    è il momento di ringraziarti

    Speaker 1 (01:02:14):
    infatti c'è un signore dietro di te
    che lo riconosco

    Michele Di Maio (01:02:18):
    che sta lì alla porta

    Francesco Facconi (01:02:21):
    che controlla che tutto vado bene
    che lo trattiamo bene
    Agnello intanto
    grazie veramente tanto

    Speaker 1 (01:02:28):
    di aver speso questa oretta con noi

    Francesco Facconi (01:02:31):
    personalmente l'ho trovata molto
    istruttiva, molto interessante
    spero che sia, anzi è un argomento molto interessante
    quello che abbiamo ascoltato
    chi sa, sa
    è molto stimolante
    anche da quel punto di vista
    se qualcuno
    fosse interessato ti troviamo immagino
    all'Università dell'Ujuta quindi

    Aniello De Santo (01:02:50):
    cerchiamo il tuo nome
    non ci sono tanti Agnello del Santo
    non ci sono tanti Agnello del Santo
    linguisti credo
    per cui
    scrivetemi se volete

    Francesco Facconi (01:03:02):
    fantastico allora grazie
    grazie Agnello
    grazie Agnello del Santo, grazie Michele
    per questa
    oretta insieme e a tutti
    quanti diamo un
    augurio di continuazione di una buona estate
    ci vediamo nel prossimo in puntate speciali e poi
    nella stagione
    tradizionale di digitale che ricomincerà il primo

    (01:03:23):
    di settembre forse
    forse
    ciao a tutti
    ciao
    Advertise With Us

    Popular Podcasts

    24/7 News: The Latest
    Dateline NBC

    Dateline NBC

    Current and classic episodes, featuring compelling true-crime mysteries, powerful documentaries and in-depth investigations. Follow now to get the latest episodes of Dateline NBC completely free, or subscribe to Dateline Premium for ad-free listening and exclusive bonus content: DatelinePremium.com

    The Clay Travis and Buck Sexton Show

    The Clay Travis and Buck Sexton Show

    The Clay Travis and Buck Sexton Show. Clay Travis and Buck Sexton tackle the biggest stories in news, politics and current events with intelligence and humor. From the border crisis, to the madness of cancel culture and far-left missteps, Clay and Buck guide listeners through the latest headlines and hot topics with fun and entertaining conversations and opinions.

    Music, radio and podcasts, all free. Listen online or download the iHeart App.

    Connect

    © 2025 iHeartMedia, Inc.