Orientarsi con le stelle (3): LLM e NLP – Si può pensare senza un corpo?

di Marco De Toffol

Per lungo tempo si è ritenuto che l’essere umano fosse in grado di pensare tramite simboli simil-linguistici (si veda Fodor e il suo mentalese) e che quindi i significati delle parole fossero dati da una lista di caratteristiche: secondo questi assunti, le parole potevano essere combinate per dare luogo a diversi significati. In seguito si è cominciato a riflettere sul fatto che avesse poco senso immaginare di fare esperienza di qualcosa e doverlo tradurre in un altro “formato” solamente allo scopo di pensare: era più semplice immaginare di essere in grado di rievocare le esperienze così com’erano, ed eventualmente di ricombinarle per immaginare scenari non ancora esperiti.

Dalla seconda metà degli anni ‘90 si sono diffuse dunque due approcci differenti rispetto al problema del linguaggio: da un lato le teorie embodied e grounded, dall’altro le teorie distribuzionali.

Le prime, teorie embodied/grounded, vedono l’origine delle parole, dei concetti e del linguaggio a partire dall’esperienza incarnata. Sono suffragate dall’evidenza che i circuiti motori cerebrali sono coinvolti nella motricità corporea e, allo stesso tempo, nel pensiero concettuale sotteso alla motricità stessa.

Queste teorie sono corroborate da una serie di conoscenze neuroscientifiche che hanno dimostrato che le aree motorie cerebrali mappano anche i concetti ad esse sottesi. Come ci ricorda Gallese in Cosa significa essere umani?, un esempio pratico può aiutare a capire meglio il concetto: a fine anni ‘80 è stato dimostrato che le aree motorie coinvolte nell’afferrare un oggetto sono le stesse indipendentemente da quale parte del corpo esegue questa azione (da qui in avanti “effettore”, sia essa la mano sinistra, quella destra o la bocca), quindi mappano non solo un atto motorio ma anche lo scopo (il concetto) di “Afferrare”. L’obiezione cognitivista muoveva dal presupposto che non fosse necessario ricorrere a speculazioni che implicassero uno scopo in quell’azione, era sufficiente ipotizzare che quei circuiti fossero coinvolti nella chiusura di vari effettori. E’ stato dunque modificato l’esperimento fornendo una pinza da pasticcere al macaco che doveva afferrare un oggetto, così che per eseguire l’azione fosse necessario aprire la mano, anzichè chiuderla: si attivavano le stesse aree premotorie e circa la metà delle aree motorie, dimostrando che nelle aree motorie viene mappato il concetto stesso di “Afferrare”.

Evidenze di questo genere non sono compatibili con l’idea che azione e pensiero siano nettamente distinti, ponendo l’esperienza incarnata alla base della conoscenza, della razionalità, del pensiero e del linguaggio umani.

Le teorie distribuzionali invece sostengono che il significato delle parole è dato grazie al giustapporsi delle altre parole che le accompagnano, e dalla frequenza con la quale occorrono assieme.
Questi modelli, fortemente cognitivi, sono alla base del funzionamento degli LLM (Large Language Model). Soprattutto, non necessitano di una soggettività nè di un’esperienza corporea per dare ragione dell’esistenza del linguaggio.

L’esistenza di questi due gruppi teorici non è solo una contrapposizione meccanicistica rispetto al funzionamento del pensiero e del linguaggio, ma pone il problema del rapporto tra significante (la forma) e significato (il contenuto, il concetto): come è possibile comprendere realmente cosa sia una sedia se non si ha mai avuto esperienza di una sedia reale? E’ possibile, o necessario, ipotizzare un modello ibrido, in cui si apprende in maniera embodied, ma si codifica a livello linguistico? Ed è possibile ottenere una comprensione del reale solo dagli input linguistici?

In Quasi Viventi, Anna Maria Borghi ricorda che esistono diversi studi in grado di supportare quest’ultima ipotesi, per almeno tre ragioni.

La prima: è stato dimostrato che persone affette da deprivazioni sensoriali intendevano i significati in maniera simile a chi non ha deprivazioni sensoriali. Ad esempio, entrambi i gruppi attribuiscono l’aggettivo “caldo” al colore rosso, sebbene le persone ipovedenti (o chi è daltonico) non potessero avere esperienza del rosso.

La seconda: sentire una parola facilita riconoscimento e categorizzazione, il che attribuirebbe un certo potere al linguaggio. Si pensi a cosa accade quando si vede una figura in lontananza, poco chiara, ma sentire che si tratta di un “albero” aiuta effettivamente a capire ciò che stiamo vedendo; oppure si pensi, all’interno di un contesto psicoterapeutico, all’importanza di attribuire un nome all’emozione che un paziente prova o ha provato per il riconoscimento dell’emozione stessa.

La terza: gli LLM sono in grado di simulare il ragionamento umano ed eseguire inferenze o desumere gli stati mentali dei personaggi delle storie, oltre a maneggiare molto bene elevati livelli di astrazione e distinguere fini differenze semantiche, pur senza comprenderle.

Soprattutto la prima argomentazione è di sostengo alle teorie distribuzionali, ma non tiene conto del fatto che le persone con deprivazioni sensoriali non perdono la capacità di fare esperienza del mondo e di relazionarsi con l’altro in maniera empatica, potendo così avere accesso indiretto ad alcune esperienze: quando le persone vedenti comunicano che il rosso è un colore caldo il punto, con il messaggio linguistico non viene solo comunicata una informazione, ma viene anche veicolata un’emozione come risultante di un’esperienza soggettiva.
La seconda invece non prescinde dall’esperienza vissuta (per vedere meglio un albero in lontananza è necessario aver avuto esperienza di cosa è un albero), e la terza non affronta il problema della relazione tra significante e significato, altrimenti non si spiegherebbe perchè un modello così avanzato non è in grado di prevenire le famose allucinazioni, ovvero informazioni totalmente inventate di sana pianta generate nel corso della conversazione con un LLM come se, appunto, non avesse consapevolezza dei concetti che sta esponendo.

Eppure è proprio nella concettualizzazione più astratta e che meno sembra essere collegata alle esperienze corporee che le teorie embodied e grounded ricevono le maggiori critiche: è sufficiente immaginare che la ricombinazione mentale di esperienze vissute possa dare luogo a nuove immaginazioni o astrazioni?

La contrapposizione tra teorie embodied e distribuzionali non ha facile soluzione, infatti la ricerca si sta muovendo verso modelli ibridi come la teoria WAT (Word As social Tool, Borghi e Cimatti), in cui viene inserito un elemento pragmatico che permette l’acquisizione dei concetti astratti: l’esperienza sociale.

Comprendere il significato di “giustizia”, per fare un esempio, è un’operazione difficilmente spiegabile come esperienza corporea, ma è più facilmente comprensibile se il concetto viene considerato come appreso dall’esperienza relazionale – si pensi al bambino e all’interazione con gli adulti nell’apprendimento della dimensione etica dell’agire relazionale, in cui il senso di ciò che è giusto viene introiettato tramite ciò che viene rimandato al discente, se così si può definire, rispetto alle conseguenze dei propri agiti nel mondo e pertanto, nei confronti degli altri.

Questo modello spiegherebbe anche il modo in cui riesce ad essere comunicato il significato del rosso come colore “caldo” a persone con deficit sensoriali, come già era stato osservato in precedenza, perchè permetterebbe di vicariare la funzione esperienziale corporea, quando non possibile, con quella esperienziale relazionale.

La cosa interessante è notare che per avere una esperienza relazionale è comunque necessario disporre di un corpo: senza di esso non è possibile una soggettività e quindi nemmeno una intersoggettività, nè la possibilità di relazione empatica, che che rappresenta, in fondo, una condizione necessaria per poter pensare nel senso umano del termine. Come già osservato in precedenza a proposito delle allucinazioni degli LLM, questa mancanza di soggettività porta al nodo dell’intenzionalità, intesa in senso fenomenologico come quella struttura fondamentale per cui ogni esperienza cosciente è sempre “coscienza di qualcosa” (Husserl). Il pensiero umano è sempre orientato verso il mondo, anche nei suoi aspetti più astratti, ed è questa direzionalità che dà significato ai concetti. Gli LLM, pur padroneggiando la sintassi e la semantica distribuzionale, mancano di questa apertura al mondo, e dunque anche della possibilità di referire nel senso pieno del termine.

Forse la domanda iniziale è sbagliata: più che chiedersi se si può pensare senza un corpo, dovremmo domandarci che parola attribuire al “pensiero non pensiero” degli LLM, e quindi cosa sia, realmente, un pensiero senza intenzionalità.

E chiederci cosa succederà se questa potenza computazionale riuscirà ad avere la possibilità di esperire e agire nel mondo: si potrà chiamare vita?

Orientarsi con le stelle (3): LLM e NLP – Si può pensare senza un corpo? by Marco De Toffol is licensed under CC BY-NC-ND 4.0