La modellizzazione computazionale della competenza inferenziale e della competenza referenziale Fabrizio Calzavarini* Antonio Lieto** *Università di Bergamo e Centro LLC Torino **Università di Torino e ICAR-CNR Palermo Abstract In philosophy of language, a distinction has been proposed by Diego Marconi between two aspects of lexical competence, i.e. referential and inferential competence. The former accounts for the relationship of words to the world, the latter for the relationship of words among themselves. The aim of the paper is to offer a critical discussion of the kind of formalisms and computational techniques that can be used in Artificial Intelligence to model the two aspects of lexical competence, and of the main difficulties related to the use of these computational techniques. The first conclusion of our discussion is that the distinction between inferential and referential semantics is instantiated in the literature of Artificial Intelligence by the distinction between symbolic and connectionist approaches. The second conclusion of our discussion is that the modelling of lexical competence needs the advent of hybrid models integrating symbolic and connectionist frameworks. Our hypothesis is that Conceptual Spaces, a framework developed by Gärdenfors more than fifteen years ago, can offer a lingua franca that allows to unify and generalize many aspects of the representational approaches mentioned above and to integrate "inferential" (=symbolic) and "referential" (=connectionist) computational approaches on common ground. 1. La distinzione tra competenza inferenziale e referenziale In filosofia e linguistica, è opinione condivisa che la semantica modellistica per il linguaggio naturale, sia nella tradizione che ha origine con il lavoro di Richard Montague (1974), sia quella che ha origine con il lavoro di Donald Davidson (1967), possa essere interpretata come una teoria della competenza semantica dei parlanti. Questa interpretazione 'cognitiva' della semantica modellistica rappresenta l'estensione naturale dell'approccio che Noam Chomsky ha riservato alla linguistica più in generale, ed è stata esplicitamente difesa in alcuni dei più influenti manuali introduttivi alla disciplina, come il manuale di Richard Larson e Gabriel Segal (1995), o quello di Gennaro Chierchia e Sally McConnell-Ginet (2000). Secondo alcuni autori, la semantica modellistica ha una controparte reale nella mente dei parlanti, nel senso che le operazioni rappresentate dalle regole ricorsive della teoria rispecchiano le reali computazioni operate dal sistema semantico del cervello umano, e la conoscenza rappresentata dagli assiomi lessicali è effettivamente immagazzinata da qualche parte nella nostra architettura cognitiva. Nonostante sia oggi molto diffusa, tuttavia, l'interpretazione cognitiva è parecchio controversa. Se appare del tutto plausibile che le componenti ricorsive della teoria possano avere un qualche ruolo nella modellizzazione della componente composizionale o 'strutturale' della competenza semantica, come ha osservato Barbara Partee (1981), è più difficile sostenere che la semantica modellistica possa offrire un resoconto adeguato della competenza lessicale umana, ovvero della nostra capacità di utilizzare le parole di un linguaggio naturale. È difficile infatti sostenere, ad esempio, che la competenza con la parola gatto possa essere modellata attribuendo al parlante la conoscenza (implicita o tacita) degli assiomi lessicali di una teoria montagoviana o davidsoniana, come ad esempio [AM] e [AD]: 2 [A1] Val (x, gatto) sse x è un gatto [A2] ValM (gatto) ∊ DM In filosofia del linguaggio, è stata recentemente proposta da Diego Marconi (1999) una distinzione tra due lati o aspetti della competenza semantica, la competenza inferenziale e la competenza referenziale. La competenza inferenziale è quell'aspetto della competenza lessicale che, in semantica modellistica, può essere trattata mediante i cosiddetti 'postulati di significato' (Carnap 1952). I postulati di significato sono essenzialmente delle stipulazioni concernenti le relazioni tra unità lessicali; più precisamente, sono stipulazioni concernenti le relazioni tra le intensioni delle parole o, in maniera equivalente, stipulazioni necessarie concernenti le loro estensioni. Ad esempio, un postulato come [MP] x) (gatto (x) → animale (x) stipula che, necessariamente, se x cade nell'estensione di gatto, allora cade anche nell'estensione di animale. I postulati di significato possono essere utilizzati per modellare l'abilità del parlante di riconoscere la validità di quelle che i filosofi chiamano inferenze 'semantiche' o 'materiali', come l'inferenza da Tom è un gatto a Tom è un animale. I postulati possono anche essere concepiti come un tipo di conoscenza esplicita, la conoscenza relativa alla rete di connessioni semantiche che legano le parole di una lingua. Ad esempio, un parlante competente sa che i gatti sono animali, che gli scapoli non sono sposati, che i mammiferi sono esseri viventi, e così via. Si noti tuttavia che la 'competenza inferenziale' nei termini di Marconi non è limitata a un tipo di conoscenza esplicita, o all'abilità di riconoscere inferenze semantiche: "l'abilità che sto cercando di circoscrivere è più generale e dinamica; è la capacità di gestire una rete di connessioni tra parole, che sta alla base di prestazioni come l'inferenza semantica, la parafrasi, la definizione, il ricupero di una parola a partire dalla sua definizione, il ricupero di un sinonimo, e così via" (1999, p. 72). Tutte queste abilità possono essere modellate, in linea di principio, mediante postulati di significato o dispositivi logici equivalenti. 1 1 Si noti che i postulati di significato sono in grado di modellare (tra le altre cose) anche il tipo di aspetti strutturali del lessico enfatizzato da molti sostenitori della semantica generativa, come Pusteyowsky, o della semantica concettuale, come Jackendoff (sul rapporto con la semantica generativa si veda Marconi 1999, pp. 24-27; su quello con la semantica concettuale, si veda Marconi 1999, pp. 95-99). Tuttavia, è importante osservare che Marconi è esplicito nell'escludere dalla sua definizione di competenza inferenziale gli aspetti strutturali del lessico: «Jackendoff [...] vuole includere nel significato lessicale "l'interazione della parola con i pattern grammaticali della lingua" [...]. Quindi, per lui, fa parte del significato di "load" [carica-re] che "X loaded a truck with furniture" [X ha caricato di mobili un camion] implica che alla fine il camion era pieno di mobili, mentre "X loaded furniture on the truck" [X ha caricato dei mobili sul camion] non comporta la medesima implicazione. Io, dal canto mio, preferisco far dipende-re queste inferenze dalla competenza strutturale anziché da quella lessicale: avrei difficoltà a dire, di uno che non sapesse svolgere le inferenze in questione, che non sa cosa significa "load"» (Marconi 1999, p. 96). 3 I postulati di significato possono forse essere sufficienti per modellare la nostra competenza con parole come democrazia, giustizia, probabilmente, e così via, ovvero parole che esprimono concetti astratti. Si potrebbe infatti sostenere che la competenza con le parole astratte non richiede altro che la capacità di fare inferenze a base semantica, o di gestire le relazioni che queste parole intrattengono con le altre parole del linguaggio. Con parole che denotano oggetti concreti, come sedia, cane, giallo, e così via, tuttavia, un parlante competente possiede una classe di abilità che difficilmente possono essere modellate mediante postulati di significato, come ad esempio, saper riconoscere e denominare un cane, o saperlo distinguere da un gatto, saper identificare qualcuno che sta correndo, e così via. Questo è l'aspetto della competenza lessicale che Marconi ha chiamato 'competenza referenziale'. La competenza referenziale consiste insomma nella base di conoscenza che ci permette di mettere in corrispondenza con successo le parole al mondo, e che richiede necessariamente l'interazione con i vari sistemi percettivi e con il sistema motorio. È plausibile pensare che il contenuto della competenza referenziale per parole concrete sia costituito da una serie di procedure che mettono in connessione le (rappresentazioni mentali delle) parole con l'output dei processi percettivi: è grazie ai sistemi di riconoscimento percettivo, infatti, che noi siamo in grado di applicare le parole a oggetti e circostanze del mondo. La competenza referenziale può essere descritta, intuitivamente, come l'abilità di determinare i valori semantici (ovvero il riferimento) dei simboli primitivi, extra-logici di un linguaggio, In questo senso, la competenza referenziale ha a che fare con la determinazione delle condizioni di verità degli enunciati. La competenza referenziale è particolarmente problematica per la semantica modellistica. Come abbiamo detto, nessun insieme di postulati di significato è in grado di modellare questo aspetto della competenza lessicale; un parlante competente che conoscesse, idealmente, tutti postulati di significato per un linguaggio naturale L non saprebbe, per ciò stesso, su cosa vertono gli enunciati di L. Per esempio, sapere che i gatti sono animali, che hanno quattro zampe, che hanno le vibrisse, che generalmente sono in grado di muoversi, e così via, non ci rende in grado di riconoscere i gatti nell'ambiente; a meno che non siamo già capaci di applicare parole come zampe, vibrisse, muoversi e molte altre parole. Ma, ancora una volta, non sono i postulati di significato a provvederci di quelle capacità. Come osserva Marconi (1999), "non importa quanti postulati di significato sono associati con le entrate di un dato lessico [mentale], non importa quanto grande e comprensivo sia questo lessico, queste connessioni intra-linguistiche non raggiungeranno mai il mondo: l'applicazione del linguaggio richiede la competenza referenziale" (p. 54). In linea di principio, non esiste alcuna ragione di aspettarsi che questa distinzione intuitiva abbia un'effettiva realtà mentale, ovvero che processi inferenziali e processi referenziali corrisponFigura 1. Una rappresentazione grafica della competenza inferenziale e della competenza referenziale. 4 dano ad abilità effettivamente differenti, o che siano gestiti da sistemi cognitivi autonomi. La distinzione potrebbe avere semplicemente il carattere di una classificazione comoda e utile delle nostre prestazioni lessicali. Almeno da un punto di vista intuitivo, tuttavia, le due classi di compiti semantici sembrano mobilitare un differente insieme di processi cognitivi. Da un lato, le prestazioni lessicali inferenziali, come il recupero di un nome a partire da una definizione o l'inferenza semantica, richiedono una combinazione di processi esecutivi, fonologici, ortografici e motori, oltre che composizionali e sintattici. Da un punto di vista lessicale, la caratteristica definente dei compiti inferenziali è che, per svolgerli correttamente, un parlante deve possedere un corpo di conoscenze relativo ai legami semantici tra unità lessicali (conoscenza inferenziale). La conoscenza inferenziale può essere concepita direttamente come un insieme di relazioni tra gli elementi presenti nel lessico mentale, ovvero l'insieme di rappresentazioni mentali delle parole. 2 Tradizionalmente, tuttavia, essa è concepita come un deposito mentale di rappresentazioni concettuali 'proposizionali', o 'quasilinguistiche', funzionalmente distinto dal lessico mentale. È chiaro che una prestazione ottimale nei compiti inferenziali non dipende solamente da quanto bene la conoscenza inferenziale/proposizionale è organizzata nel sistema cognitivo, ma anche dal fatto che il parlante sia in possesso di strategie cognitive efficienti che rendano possibile la manipolazione e lo sfruttamento di questa base di conoscenza durante il compito (procedure inferenziali) (si veda Marconi 1999). 2 Si noti tuttavia che Marconi non intende la competenza inferenziale in questo senso: «[L]a competenza inferenziale non può...essere descritta come la capacità di gestire una rete di relazioni tra parole. La distinzione tra forme di parola (lessici di output) e lessico semantico ci costringe a ridescrivere le prestazioni in cui si dispiega tipicamente la competenza inferenziale (come la parafrasi, l'inferenza a base semantica, ecc.) come prestazioni in cui si seguono percorsi da parola a parola attraverso il lessico semantico» (Marconi 1999, p. 86). Dunque, Marconi riconosce esplicitamente l'esistenza di una rete di componenti concettuali distinta dalle rappresentazioni delle parole (si veda dalla figura 2). Figura 2. Una rappresentazione grafica dei processi cognitivi coinvolti nei compiti inferenziali. 5 Dall'altro lato, anche le prestazioni referenziali, come la denominazione di un'immagine o l'applicazione di una parola a un'immagine, coinvolgono processi attenzionali, esecutivi, fonologici e motori. Rispetto alle prestazioni inferenziali, la differenza cruciale è che le prestazioni referenziali coinvolgono pesantemente la modalità visiva. Si noti che non è la percezione visiva di per sé a fare la differenza; i processi visivi primari sono necessari anche nei compiti inferenziali al fine di elaborare gli stimoli linguistici che sono presentati in input. Piuttosto, la caratteristica definente dei compiti referenziali è che essi richiedono il riconoscimento di stimoli non linguistici, come oggetti presentati visivamente, o raffigurati in immagini e disegni. Chiaramente il riconoscimento visivo implica la percezione; al fine di riconoscere un oggetto, occorre prima poterlo percepire. Tuttavia, ci sono molte ragioni teoriche ed empiriche per distinguere i due processi (si veda Mar coni 1999, Farah 2004). Si noti anche che, per una prestazione ottimale nei compiti referenziali, il riconoscimento visivo non è sufficiente; è necessario postulare anche una serie di procedure cognitive che siano in grado di collegare sistematicamente le parole con l'output del sistema di riconoscimento visivo. Per ogni elemento immagazzinato nel lessico mentale, possiamo immaginare almeno due tipologie di procedure cognitive: (i) una procedura di denominazione referenziale, che rende possibile il recupero all'interno del lessico mentale della parola che corrisponde ad un dato oggetto riconosciuto; (ii) una procedura di applicazione referenziale, che prende una parola nel lessico mentale in input e attiva una procedura di ricerca che mira ad individuare un determinato oggetto all'interno del campo visivo (per una discussione, si veda Marconi 1999, Paternoster 2001). La recente ricerca empirica ha suggerito che la distinzione potrebbe essere implementata cognitivamente, ovvero che differenti sottosistemi, con realizzazioni neurali almeno parzialmente dissociate, potrebbero essere responsabili delle prestazioni cognitive che coinvolgono gli aspetti inferenziali e referenziali della semantica. Questa ipotesi si accorda per esempio con alcuni dati provenienti da studi neuropsicologici, che suggeriscono che abilità inferenziali e referenziali possono essere selettivamente danneggiate a seguito di una lesione cerebrale. Un lato della dissociazione funzionale in esame, ovvero il danneggiamento selettivo della competenza referenziale, è ben attestato in letteratura, ed è comune nella sindrome nota come 'afasia ottica', caratterizzata dall'inabilità di denominare stimoli visivi in un contesto in cui le abilità cognitive e linguistiche, e in particolar quelle inferenziali, sono perfettamente preservate (Farah 2004). Il secondo lato della dissociazione Figura 3. Una rappresentzione grafica dei processi cognitivi coinvolti nei compiti referenziali. 6 funzionale in esame, ovvero il danneggiamento selettivo della competenza inferenziale, è decisamente meno frequente, anche in anni recenti sono stati descritti numerosi pazienti che sembrano istanziare questa condizione patologica (ad esempio, Heilman 1981; Shuren 1993; per una rassegna completa, si veda Calzavarini 2019). La teoria duale della competenza lessicale proposta da Marconi è inoltre supportata da una serie di studi di neuroimmagine, che suggeriscono che compiti inferenziali e referenziali attivano aree almeno parzialmente dissociate del cervello umano (ad esempio, Marconi et al. 2013). I compiti referenziali tendono infatti ad attivare selettivamente alcune aree visivo/semantiche dell'emisfero destro, come il giro fusiforme destro, mentre i compiti inferenziali tendono ad attivare selettivamente alcune regioni dell'emisfero sinistro, in particolare la porzione posteriore del giro temporale medio sinistro (Marconi et al. 2013). 3 Un'analisi critica di questi dati e delle loro implicazioni per i modelli neurocognitivi della competenza lessicale è stata offerta da uno dei due autori del presente saggio in una serie di lavori precedenti (Calzavarini 2017, 2018, 2019). In questo articolo, ci focalizzeremo invece su alcune questioni teoriche che riguardano la modellizzazione computazionale della competenza inferenziale e referenziale nell'ambito dell'Intelligenza Artificiale (IA) e della Rappresentazione della Conoscenza. Ci occuperemo in particolar modo di fornire una rassegna critica dei principali approcci computazionali mediante i quali si è tentato di creare sistemi artificiali in grado di approssimare, se non addirittura raggiungere, le prestazioni umane in compiti inferenziali e referenziali. Anticipando gli esiti della nostra discussione, la distinzione proposta da Marconi sembra riflettersi in nella distinzione tra le due principali classi di formalismi utilizzati in IA: da una parte, i formalismi simbolici, come i sistemi logici basati su postulati di significato, o come le reti semantiche e i frames); dall'altra, le reti neurali artificiali, o connessionismo, e in particolari le recenti tecniche basate su deep learning. I formalismi simbolici, infatti, sono tuttora dominanti per quanto concerne la modellizzazione della competenza inferenziale, mentre non sono in grado di operare il cosiddetto grounding referenziale (§2). Le reti neurali, invece, forniscono oggi risultati più che soddisfacenti nel riconoscimento e nella denominazione referenziale (visiva), mentre sono ancora lontane dal modellare in modo adeguato la competenza inferenziale (§3). Su queste basi, diviene chiaro che la creazione di un sistema artificiale dotato di entrambi gli aspetti della competenza lessicale richiederà una qualche forma di integrazione tra formalismi simbolici e formalismi neurali/connessionisti (§4). Nella conclusione del nostro articolo, accenneremo brevemente a quella che, a nostro avviso, rappresenta una strada promettente per operare tale integrazione. 2. La modellizzazione della competenza inferenziale L'ipotesi della distinzione tra competenza inferenziale e referenziale, formulata inizialmente nel contesto della filosofia del linguaggio e della scienza cognitiva, insieme all'evidenza sperimen- 3 Ciò non significa che i sostrati neurali della competenza inferenziale e della competenza referenziale siano completamente disgiunti. Alcuni studi di neuroimmagine, infatti, hanno evidenziato l'attivazione di aree referenziali visive (primarie e/o secondarie) durante compiti inferenziali come la denominazione da definizione (Bookheimer et al. 1998), o il completamento di enunciati (Mestres-Missé, Münte e Rodriguez-Fornells 2009). Questo tipo di attivazioni è generalmente considerato dai sostenitori dell'ipotesi della embodied semantic come evidenza del fatto che le rappresentazioni visive sono un componente critico dell'elaborazione semantica. Resta tuttavia aperta l'ipotesi che le attivazioni in questione riflettano il coinvolgimento di processi cognitivi che semplicemente accompagnano i compiti inferenziali, pur non essendo essenziali per essi. A sostegno di questa seconda ipotesi, molti studi di lesione hanno mostrato che un danno che aree referenziali (ad esempio, giro fusiforme e/o corteccia infero-temporale) non è accompagnato da un peggioramento delle performance dei pazienti in compiti inferenziali da denominazione da definizione (ad esempio, Hillis e Caramazza 1995; Campbell e Manning 1996). Per una discussione sul rapporto tra embodied semantics e teoria inferenziale-referenziale della competenza lessicale di veda Calzavarini 2019 (capitolo 8). 7 tale a cui abbiamo accennato nel paragrafo precedente (relativa a come competenza inferenziale e referenziale potrebbero essere istanziate a livello neurale), possono fornire lo sfondo teorico per una serie di tentativi di modellizzazione computazionale che coinvolgono i due aspetti della competenza lessicale. Quali sono i formalismi e le tecniche che possono essere utilizzate per modellare la competenza inferenziale e referenziale? Quali sono le maggiori difficoltà legate a questi tipi di approcci? Come abbiamo detto, la competenza inferenziale ha una connessione tradizionale con i postulati di significato. È noto che l'utilizzo dei postulati di significato è ancora diffuso non solo all'interno della comunità filosofica, ma anche nel dominio dell'IA e della Rappresentazione della Conoscenza. In particolare, questa è la soluzione adottata per una classe di formalismi logici noti come Description Logics [DLs] (Baader et al. 2010). A livello tecnico, i sistemi DL sono sottoinsiemi decidibili della logica del prim'ordine in cui una semantica tarskiana standard è associata direttamente alla sintassi del linguaggio. La decidibilità è solitamente ottenuta restringendo l'insieme delle variabili che possono essere inserite all'interno delle formule e l''arità' delle relazioni. Diversamente dai dimostratori del prim'ordine, gli algoritmi di decisione DL dovrebbero terminare in un tempo finito e ragionevole, il che permette, almeno in linea di principio, di raggiungere una maggiore plausibilità cognitiva nella simulazione delle procedure inferenziali umane. Nei sistemi DL, la conoscenza inferenziale è espressa mediante 'assiomi terminologici', semplici varianti notazionali dei più classici postulati di significato, ovvero enunciati (bi)condizionali che vincolano l'estensione delle costanti descrittive che appaiono nell'antecedente. L'approccio alla modellizzazione della competenza inferenziale basato su postulati di significato non è immune da problemi. Per esempio, è noto che i sistemi logici con postulati di significato possono esprimere a livello formale solamente le relazioni semantiche 'rigide' tra parole o concetti, ovvero relazioni che non ammettono eccezioni (ad esempio, se x è uno scapolo, allora x è non sposato). Per questa ragione, i sistemi DL standard con postulati di significato non sono in grado di modellare la conoscenza prototipica e il ragionamento plausibile (defeasible reasoning), due aspetti essenziali della competenza inferenziale umana (Marconi 1999). Recentemente sono state proposte differenti tecniche formali per far fronte a questa difficoltà (per una rassegna, si veda Lieto 2013). Una soluzione semplice potrebbe consistere nell'integrare un insieme di postulati di significato con una logica non monotòna 4 come la Default Logic. Questa soluzione è stata adottata da Baader e 4 Com'è noto, le logiche non monotòne sono una classe di formalismi logici in cui la conclusione non è una conseguenza logica (in senso deduttivo) delle premesse. Nel corso degli ultimi decenni, sono state proposte numerose logiche di questo tipo, come ad esempio la Default Logics o la Fuzzy Logics (per una discussione, si veda la voce "Non- Figura 4. Un esempio di insieme di assiomi terminologici in un sistema DL. 8 Hollunder (1995), ad esempio, i quali, tuttavia, mettono in risalto anche una serie di difficoltà computazionali collegate a questa integrazione. La letteratura recente, inoltre, offre diversi tentativi di formulare estensioni di sistemi DL basati sulla Fuzzy Logics (ad esempio, Calegari et al., 2007), o su formalismi probabilistici come la teoria di Bayes (Lukasiewicz et al., 2007). Nonostante questi progressi computazionali, tuttavia, l'uso di logiche non monotòne e, in generale, di logiche non classiche in questo campo dell'IA non è una pratica universalmente accettata. Generalmente, i sistemi basati su una semantica tarskiana classica più postulati di significato, come i sistemi DL standard, sono preferiti per ragioni pratiche (si veda Frixione & Lieto, 2011). Dunque, in IA, la rappresentazione della conoscenza prototipica e del ragionamento plausibile mediante postulati di significato rimane, in ultima analisi, un problema aperto. L'approccio alla modellizzazione della competenza inferenziale basato sui sistemi DL può essere senza dubbio classificato come un approccio di IA simbolica, o 'classica', un paradigma che è stato dominante in IA almeno fino alla fine degli anni Ottanta, e che si basa sull'assunto che la computazione debba operare su simboli proposizionali, o 'quasi-linguistici', in grado di supportare la composizionalità semantica. I postulati di significato non sono certamente l'unico approccio simbolico possibile alla competenza inferenziale. La questione relativa a come la conoscenza inferenziale (e, più in generale, la conoscenza semantica) e le procedure inferenziali possano essere formalmente rappresentate è l'oggetto di ricerca di molte sotto-discipline dell'IA simbolica e, nel tempo, sono state proposti e sviluppati molti formalismi alternativi ai postulati di significato, come le reti semantiche (ad esempio, Collins e Quillan 1969) o i frames (ad esempio, Minsky 1975). Secondo alcuni autori, questi approcci hanno un potere espressivo maggiore rispetto ai postulati di significato. Per esempio, è stato sostenuto che almeno alcuni sistemi di rappresentazione basati sulle reti semantiche forniscono analisi semantiche delle parole che 'vanno molto al di là dei confini della logica del prim'ordine' (Israel 1983, p. 2). In modo simile, è stato detto che, contrariamente ai postulati di significato, la semantica basata sui frames può facilmente are conto del problema della conoscenza prototipica e del ragionamento plausibile (ad esempio, Minsky 1975). In questo tipo di paradigma computazionale, infatti, è possibile esprimere formalmente i tratti prototipici di una categoria mediante 'valori di default', ovvero valori che la categoria riceve in mancanza di informazione più specifica (ad esempio, se x è un uccello, allora x può volare), ma che informazione ulteriore può annullare (x è un pinguino). Nei limiti di questo saggio non ci è possibile offrire un confronto dettagliato tra l'approccio alla competenza inferenziale basato sui postulati di significato e gli approcci alternativi basati sul paradigma simbolico (per questo si veda Marconi 1999, pp. 7-28). Una questione che merita di essere brevemente discussa, invece, riguarda i punti di forza e i limiti della semantica distribuzionale, un approccio modellistico non simbolico che ha acquisito recentemente grande popolarità in psicologia e nel campo dell'elaborazione automatica del linguaggio naturale (per una rassegna, si veda Lenci 2018; anche Lenci 2008). I modelli distribuzionali sono attraenti, innanzitutto, perché non sono necessariamente supervisionati; essi sono cioè in grado di derivare automaticamente rappresentazioni semantiche delle parole attraverso un'analisi statistica della loro distribuzione in estesissimi corpora linguistici. Secondo molti autori, la semantica distribuzionale, inoltre, può anche essere considerata come una potente ipotesi cognitiva relativa alla forma e all'origine della conoscenza e delle procedure inferenziali umane (ad esempio, Andrew et al. 2009). Secondo questa visione, la costante esposizione al linguaggio porterebbe il bambino a formarsi un insieme di rappresentazioni dei contesti linguistici più significativi in cui una determinata parola è utilizzata, e le procedure inferenziali umane sarebbero sorrette da meccanismi cognitivi che operano analisi statistiche simili a quelle utilizzate nei modelli distribuzionali. Questa ipotesi empirica è supportata dal fatto che i modelli distribuzionali sono stati utilizzati con successo per simulare le prestazioni umane in una varietà di compiti inferenziali. Per esempio, una delle cose più pubblicizzate della Latent Semantic Ana- monotonic Logic" sulla Stanford Encyclopedia of Philosophy. 9 lysis 5 è l'abilità dei modelli basati su questa tecnica di ottenere dei punteggi molto elevati nei compiti inferenziali del TOFL, oltre la soglia di quelli richiesti per entrare nella maggior parte dei college britannici. Anche le prestazioni umane in compiti inferenziali come compiti di generazione di proprietà, di completamento di enunciato, o di priming semantico sono state simulate con successo dai modelli distribuzionali. 6 Nei modelli distribuzionali, com'è noto, la conoscenza inferenziale è rappresentata mediante spazi vettoriali a n-dimensioni che codificano i pattern di co-occorrenza di una data parola all'interno del corpus linguistico di riferimento. Le rappresentazioni della semantica distribuzionale sono difficilmente assimilabili ai formalismi simbolici, dal momento che in esse l'informazione semantica è codificata in modo graduale e distribuito, piuttosto che in modo discreto e categorico (si veda Lenci 2018). Cosa più importante, i modelli distribuzionali, chiamati anche word embeddings, sono stati recentemente ottenuti a partire da reti neurali artificiali, e i modelli risultanti sono talvolta chiamati neural word embedding. Nel paradigma della semantica distribuzionale, esistono oggi molti modelli che si basano su tecniche connessioniste, che vanno da modelli basati su semplici reti ricorrenti (Elman 1990) fino a più complesse architetture profonde (Collobert & Weston 2008). Il più popolare tra questi modelli è Word2vec, originariamente progettato da Tomas Mikolov e colleghi (2013). Si tratta di una semplice rete neurale a due strati che prende in input un corpus linguistico e restituisce un insieme di vettori che rappresentano la distribuzione semantica delle parole nel testo. Il modello ha ora due versioni, una versione che predice la parola target basandosi sull'analisi del contesto linguistico (Continuous Bag of Words model), e una versione che predice il contesto linguistico sulla base di una data parola in input (Skip-gram model) (Mikolov et al. 2013). Nonostante la popolarità acquisita, tuttavia, a nostro parere molti problemi teorici ancora affliggono l'approccio distribuzionale/connessionista alla competenza inferenziale. La limitazione più importante è che, da un punto del potere computazionale, la semantica distribuzionale è ancora molto debole. Per esempio, a livello lessicale, i modelli distribuzionali sono a grana troppo grossa, dal momento che sono sensibili solo alla parentela (relateness) semantica tra le parole, una misura 'inferenziale' che in realtà include differenti tipi di relazioni di senso, ognuna con differenti proprietà logiche e con differenti pattern di inferenza collegati (sinonimia, antinomia, iponimia, eccetera). La ragione di ciò è che la distribuzione delle parole nei contesti linguistici non è sensibile alle differenze tra queste relazioni di senso. Di conseguenza, i modelli basati sulle rappresentazioni distribuzionali non sono in grado di eseguire semplici compiti inferenziali come, ad esempio, distinguere coppie di parole sinonime da coppie di parole antinomiche. Recentemente sono state proposte differenti strategie allo scopo di codificare dati semantici a grana più fine a partire dalla distribuzione linguistica. Ad esempio, i modelli basati su pattern (Hearst 1992) sono in grado di individuare gli schemi lessico-sintattici che sono di norma utilizzati per esprimere una data relazione semantica (iponimia: 'x is a kind of y'; antinomia: 'x hence not y'), mentre i modelli basati su analogia (Turney 2006) tentano di isolare specifici schemi di co-occorrenza che sono caratteristici delle varie relazioni di senso. Tuttavia, la reale efficacia di queste strategie non è stata ancora dimostrata in modo conclusivo (si veda Lenci 2008). Inoltre, l'abilità dei formalismi distribuzionali di modellare fenomeni semantici di base come la composizionalità, la negazione, la quantificazione, la polisemia, o le inferenze che coinvolgono i connettivi logici è ancora una questione aperta (si veda Baroni 2013). Dunque, almeno per lo stato attuale, l'abilità della semantica distribuzionale di simulare le procedure inferenziali è ancora bel al di sotto dei formalismi simbolici tradizionali, e i postulati di significato appaiono ancora l'approccio più efficacie per modellare l'aspetto inferenziale della competenza lessicale umana. 5 La Latent Semantic Analysis è una tecnica computazionale utilizzata nell'ambito dei modelli distribuzionali originariamente introdotta da Landauer e Dumais (1997). 6 Per i riferimenti bibliografici di questi studi, si veda ad esempio (Baroni e Lenci, 2010). 10 3. La modellizzazione della competenza referenziale Nel paragrafo precedente, abbiamo brevemente discusso alcuni dei paradigmi computazionali che sono tradizionalmente utilizzati nella modellizzazione della competenza inferenziale. Abbiamo visto che, nonostante l'avanzare di tecniche vettoriali/connessioniste, gli approcci simbolici ancora sono dominanti in questo campo. Il punto cruciale è che nessuno dei formalismi simbolici che abbiamo discusso sembra essere in grado di modellare l'aspetto referenziale della competenza lessicale, ovvero la nostra abilità di applicare le parole a oggetti del mondo. Immaginiamo di dotare un programma di computer di un insieme completo di postulati di significato in grado di esprimere tutte le relazioni inferenziali che esistono tra i termini del lessico di una lingua. Questo sistema sarebbe in grado di simulare molte delle sofisticate abilità semantiche dei parlanti del linguaggio naturale (competenza inferenziale). Inoltre, il sistema possiederebbe molte informazioni sui referenti di una particolare parola; ad esempio, saprebbe che i gatti sono animali, che hanno quattro zampe e una coda, che miagolano, eccetera. Tuttavia, questo sistema rimarrebbe un mero 'manipolatore di simboli' (Searle 1980), senza alcun accesso al mondo esterno. Non sarebbe ad esempio in grado di denominare un gatto nell'ambiente, o un'immagine di gatto, di verificare un enunciato come C'è un gatto sotto il tavolo se posto in una situazione reale, di ubbidire a un ordine come Colpisci il gatto, e così via. Questo perché tutte queste azioni dipendono in ultima analisi dall'abilità di riconoscere oggetti attraverso i sistemi percettivi, in particolar modo il sistema visivo, e nessun insieme di postulati di significato può modellare questa abilità. Ciò che è importante osservare è che nessuno dei formalismi tradizionali che abbiamo menzionato nel paragrafo precedente fa meglio dei postulati di significato nel modellare la competenza referenziale. Reti semantiche o frame sono solo 'strutture inferenziali' (Marconi 1999), senza alcuna connessione intrinseca con la percezione o con il mondo esterno. Si noti che questo problema del grounding (Harnad 1980) non può essere risolto semplicemente combinando rappresentazioni simboliche come postulati di significato, reti semantiche, o frame con insiemi di immagini digitalizzate. Molte teorie della competenza semantica identificano semplicemente la competenza referenziale con un certo insieme di immagini mentali associate con gli elementi del lessico mentale; per esempio, l'immagine di un cane, di un gatto, o di un uomo che corre. Secondo questa visione, noi applichiamo parole come cane, gatto e correre semplicemente confrontando queste immagini mentali con l'output della percezione visiva. Come osserva Marconi (1999), il riferimento a immagini mentali non è sufficiente per rendere conto della nostra abilità di connettere le parole al mondo esterno: Si immagini un sistema artificiale dotato di una lista di parole (cane, gatto, delfino, poltrona, automobile, ecc.) ciascuna delle quali ha un puntatore a un'immagine digitalizzata (di un cane, un gatto, e così via); e si immagini che il sistema sia dotato di visione artificiale, nel senso che è in grado di elaborare segnali luminosi fino a ottenere rappresentazione a 2 1⁄2 D di Marr. Con tutto ciò, il sistema non saprebbe decidere se la scena percepita contiene o no un cane, a meno di essere dotato di procedure per confrontare le figure del suo catalogo con le rappresentazioni a 2 1⁄2 D (p. 174). Il punto importante in questo contesto è che, per qualche approccio computazionale alla competenza semantica e alla competenza referenziale, "l'intero onere esplicativo è sostenuto dalla relazione di confronto fra immagine e quadro percettivo; e la relazione in questione (o processo, o quel che è) non viene spiegata in nessun modo" (p. 173). Questo è vero anche di molte teorie della connessione tra linguaggio e percezione, come quella di Jackendoff (1985), che fa ricorso a modelli 3D di Marr come immagini altamente strutturate collegate alle parole del lessico mentale. Queste teorie non possono essere ancora considerate come modelli adeguati della competenza referenziale, dal momento che sono prive di un resoconto adeguato delle procedure di riconoscimento che mettono in corrispondenza l'insieme di immagini digitalizzate interne con l'output dei processi visivi. 11 "Per un sistema artificiale", osserva Marconi (1999), "la competenza referenziale comincia dalla visione artificiale" (p. 173). In particolare, la modellizzazione computazionale del sistema referenziale di riconoscimento visivo è l'oggetto della cosiddetta High-Level Computer Vision (si veda Forsyth & Ponce 2002, pp. 365-554). Si noti che i primi tentativi di modellizzazione del riconoscimento visivo si basavano su rappresentazioni simboliche (benché distinte da postulati di significato, frame o reti semantiche), e i formalismi simbolici sono stati presenti in questo campo almeno fino agli inizi di questo secolo. Ad esempio, il sistema di visione cognitiva proposto da Nagel (2004), sviluppato per il riconoscimento visivo di sequenze video (scene di traffico) e la generazione di descrizioni in linguaggio naturale della scena osservata, utilizzava rappresentazioni simboliche basate sulla fuzzy metric temporal Horn logic. 7 Tuttavia, nell'ultimo decennio, il paradigma computazionale più adottato in visione artificiale è senza dubbio quello connessionista basato sulle reti neurali artificiali, una classe di rappresentazioni utilizzate con successo in molti difficili compiti percettivi come la categorizzazione, l'apprendimento visivo, il riconoscimento di pattern, e così via. Diversamente dai formalismi simbolici, le reti neurali ricevono di dati in input direttamente dai sistemi sensoriali, ad esempio immagini o segnali acustici; di conseguenza il problema del grounding, secondo alcuni autori, è in qualche senso alleviato per questa classe di rappresentazioni (si veda ad esempio Harnad 1990 a riguardo). Da questo punto di vista, il vantaggio maggiore delle reti basate sul deep learning, e in particolar modo delle reti neurali convoluzionali, è che sono 'vicine', in termini rappresentazionali, ai dati sensoriali, e non necessitano dunque di una elaborazione preliminare dell'input (per una rassegna, si veda LeCun et al. 2015). È interessante osservare come molti dei modelli computazionali sviluppati in questo campo, compresi quelli basati sulle tecniche di deep learning, non contengano letteralmente delle immagini, nemmeno immagini digitalizzate. Per esempio, nei cosiddetti modelli Appearance-Based [AB] (si veda Siciliano & Khatib 2008), le classi di oggetti che il sistema è in grado di riconoscere (gatti, tavoli, e così via) sono identificati con rappresentazioni basate su tratti (feature-based), che vengono esse stesse interpretate come spazi n-dimensionali dove i componenti vettoriali rappresentano i tratti selezionati. Molti modelli computazionali in questa tradizione usano tratti di basso livello come tratti geometrici (punti, linee, curve, ecc.), numero di vertici o lati, variazioni di distribuzioni di flusso ottico, rapporti tra lunghezza e larghezza, e così via. Nei modelli AB, le procedure referenziali di riconoscimento sono formalmente espresse mediante un insieme di algoritmi di matching che mettono in corrispondenza l'insieme di tratti (feature) derivati da un'immagine con le rappresentazioni immagazzinate (sotto forma di spazi vettoriali) delle classi di oggetti. In anni recenti, il potere computazionale dei modelli AB è cresciuto considerevolmente, e l'abilità di alcuni di questi modelli di simulare le prestazioni umane in compiti referenziali come la categorizzazione e la denominazione visiva è oggi più che soddisfacente (per una rassegna, si veda Crouzet & Serre 2014). In questo contesto, tuttavia, è importante accennare anche alle intrinseche limitazione dell'approccio al riconoscimento visivo basato sui modelli AB. Una limitazione importante riguarda il fatto che i modelli AB non rappresentano formalmente le relazioni spaziali tra le parti differenti di un oggetto. Di conseguenza, i modelli AB non sono in grado di distinguere i visi reali da visi in cui gli occhi, il naso, e la bocca sono disposti spazialmente in modo casuale, o di distinguere le biciclette normali da biciclette in cui le ruote sono poste sul manubrio. Alla luce di queste difficoltà, si è recentemente assistito, nel campo della Computer Vision, a un rinnovato interesse per i primi approcci 'geometrici' al riconoscimento visivo basati sulla scomposizione degli oggetti in primitivi volumetrici (ad esempio, Marr & Nishihara 1978). In questi sistemi, che sono oggi noti come modelli Constellation-Based [CB] (Siciliano & Khatib 2008), l'informazione referenziale è rappresentata mediante modelli strutturali 3D che rappresentano la forma di (classi di) oggetti. Un modello strutturale di un oggetto è essenzialmente una rappresentazione formale delle parti di un oggetto combinata con una rappresentazione formale delle loro connessioni; si tratta di norma di una strut- 7 Si tratta di un tipo particolare di logica fuzzy, legata a elementi temporali, in grado di modellare l'incertezza tramite clausole di Horn (espressioni del tipo se...allora). 12 tura di dati 'a grafo' in cui i vertici corrispondono alle n parti dell'oggetto e gli archi rappresentano come le parti sono connesse tra loro. Le procedure di riconoscimento sono identificate con algoritmi di matching che decidono se il modello strutturale di un oggetto estratto dalla scena percettiva corrisponde a uno qualsiasi dei modelli strutturali conservati in memoria. Come è facile immaginare, anche i modelli CB non sono immuni da problemi, e sono stati sottoposti a critiche sia dal punto di vista del loro potere computazionale che dal punto di vista della loro plausibilità psicologica (si veda, ad esempio, Rolls 2016). Tuttavia, il punto cruciale in questo contesto è che, almeno in linea di principio, è possibile modellare il contenuto del sistema di riconoscimento visivo umano mediante reti neurali artificiali basate su rappresentazioni strutturali degli oggetti conosciuti, o su insiemi di rappresentazioni a tratti immagazzinate in memoria, combinati con algoritmi di matching che mettano in corrispondenza queste rappresentazioni con le rappresentazioni degli oggetti percepiti. Come ultimo punto, è importante osservare che, come abbiamo detto, la modellizzazione del riconoscimento visivo non è ancora sufficiente per la competenza referenziale; è anche necessaria la modellizzazione delle procedure di denominazione e di applicazione referenziale che connettono il sistema di riconoscimento visivo con il lessico mentale (si veda §2). Si può essere tentati di identificare queste procedure con meccanismi automatici che connettono direttamente il sistema di riconoscimento con il lessico mentale, 'bypassando' il sistema semantico (proposizionale). Questo è ciò che accade generalmente nei modelli computazionali di riconoscimento e denominazione visiva, come ad esempio nel sistema computazionale proposto da Meini e Paternoster (1996). Nel sistema in questione, implementato in linguaggio LISP 8 e denominato REFMACHINE, agli elementi lessicali sono associati due tipi di puntatori: uno ad un insieme di postulati di significato, l'altro ad un sistema artificiale di riconoscimento visivo (non implementato). In modo cruciale, i due puntatori sono indipendenti dal punto di vista funzionale, nel senso che le procedure referenziali di denominazione e applicazione visiva non devono necessariamente mobilitare, per poter essere attivate, la base di conoscenza proposizionale/inferenziale rappresentata dai postulati di significato. 4. Verso un'integrazione inferenziale-referenziale Per riassumere, in questo saggio abbiamo fornito una breve rassegna critica delle principali tecniche e formalismi tipicamente usati in Intelligenza Artificiale (IA) per la modellazione, rispettivamente, della competenza inferenziale e della competenza inferenziale. La conclusione teorica principale della nostra rassegna sembra essere che la distinzione inferenziale/referenziale trova un corrispettivo nella distinzione tra i due principali tipi di formalismi computazionali utilizzati in IA e Rappresentazione della Conoscenza, ovvero i formalismi simbolici e quelli basati sulle reti neurali artificiali (connessionismo). Da una parte, abbiamo viso come i formalismi simbolici (postulati di significato, reti semantiche, frames, ecc.) sono in grado di modellare gli aspetti inferenziali della competenza lessicale, ma non hanno le risorse per risolvere il problema del grounding referenziale, ovvero della connessione tra parole e oggetti del mondo esterno tramite la percezione (visiva). Dall'altra parte, abbiamo visto come i sistemi basati su reti neurali artificiali, e in particolar sul deep learning, sono in grado di emulare in modo soddisfacente le prestazioni referenziali umane, come il riconoscimento e la denominazione visiva, ma risultano inefficaci, allo stato attuale, per la modellizzazione di aspetti inferenziali basilari come la composizionalità e le inferenze a base semantica. Chiaramente non è possibile sostenere che questa situazione possa fornire un ulteriore sostegno empirico diretto, in aggiunta ai dati già esistenti, per la realtà psicologica della distinzione tra competenza inferenziale e referenziale. Questo anche perché la maggior parte dei sistemi artificiali che 8 Il LISP è uno dei primi e tra i più utilizzati linguaggi di programmazione sviluppati in Intellligenza Artificiale. L'acronimo sta per List Processor. Si tratta di un linguaggio introdotto da John McCarthy nel 1958. 13 abbiamo descritto non aveva esplicitamente di mira la plausibilità cognitiva o neurale. Tuttavia, l'esito della nostra rassegna certamente supporta la legittimità e l'utilità della distinzione proposta da Marconi in sede di modellizzazione della competenza lessicale. La nostra rassegna, inoltre, rende chiaro che, per ottenere un sistema artificiale in grado di esibire contemporaneamente sia competenza inferenziale che referenziale, è necessario operare un qualche tipo di integrazione tra formalismi simbolici/inferenziali e formalismi connessionisti/referenziali. Com'è noto, questo tipo di integrazione è l'oggetto principale di una corrente dell'IA nota come NESY (Neuro-Symbolic Integration), che cerca di superare le limitazioni intrinseche di ciascuno dei due approcci computazionali mediante la realizzazione di sistemi ibridi, anche detti neuro-simbolici. L'obiettivo centrale di questa corrente è capire come una funzione simbolica possa essere implementata in una rete neurale artificiale, da una parte, e come una rete neurale artificiale possa essere descritta e analizzata in termini logici, dall'altra. Tale obiettivo viene perseguito o applicando algoritmi di 'traduzione' tra simboli logici e rappresentazioni neurali, o facendo uso di dimostrazioni di equivalenza formale (Besold et al. 2017). Riguardo le possibili applicazioni, l'integrazione neuro-simbolica è stata utilizzata in vari domini, che includono la bioinformatica, l'ingegneria dei software, e la robotica. Nei limiti del presente saggio, non ci è possibile considerare nel dettaglio tutte le problematiche di tale ambito di ricerca dell'IA. Un problema principale che occorre menzionare, tuttavia, è dato dal fatto che, nella maggioranza dei sistemi ibridi esistenti, l'integrazione neuro-simbolica è, solitamente, ad hoc (Chella et al. 2003). Ciò significa che la mappatura tra il risultato di una rete neurale per il riconoscimento visivo e un elemento lessicale che risiede all'interno di una rete simbolica viene eseguita manualmente dal programmatore. Nella parte conclusiva di questo saggio, accenneremo brevemente a quella che, a nostro avviso, rappresenta una possibile soluzione di questo problema e dunque, indirettamente, una possibile soluzione per l'integrazione di competenza inferenziale e referenziale in sistemi artificiali. Tale soluzione è secondo noi fornita dal paradigma teorico degli 'spazi concettuali', un tipo di formalismo geometrico per la rappresentazione della conoscenza introdotto da Peter Gärdenfors (2000) e impiegato in una vasta gamma di applicazioni IA che spaziano dalla percezione visiva e alla robotica a, più recentemente, sistemi di elaborazione del linguaggio naturale e sistemi di question/answering (per una rassegna, si veda Zenker e Gardenfors 2015). Gli spazi concettuali possono essere concepiti come un tipo particolare di modello vettoriale in cui le entità sono rappresentate all'interno di spazi metrici multidimensionali, e in cui ogni dimensione rappresenta una qualità cognitivamente saliente dell'entità in questione, come ad esempio il suo colore, la sua forma, o la sua dimensione. Questo tipo di formalismo è stato originariamente pensato come formato rappresentazionale 'intermedio' tra sistemi simbolici e sistemi connessionisti (e, più di recente sistemi diagrammatici, si veda Lieto, et al. 2018). Da un lato, infatti, gli spazi concettuali permettono di superare alcune limitazioni classiche dei sistemi simbolici, permettendo la modellizzazione di diversi aspetti di ragionamento di senso comune, come il ragionamento prototipico o il ragionamento basato su esemplari (Lieto et al. 2018). Dall'altro lato, essi permettono di alleviare il problema dell'opacità delle reti neurale fornendone un'interpretazione di più alto livello. Lo stesso Gardenfors ha mostrato come gli spazi concettuali permettono una interpretazione astratta di reti neurali come le Self-Organizing Maps 9 (2000), mentre Belkenius (1999) ha mostrato come integrare in un sistema artificiale spazi concettuali e rappresentazioni neurali in modo automatico e non-ad hoc. Balkenius (1999) ha anche proposto un'interpretazione più articolata delle reti Radial Basis Function 10 in termini di spazi concettuali. Nel contesto della visione artificiale, la proposta di utilizzare il framework degli spazi concettuali come elemento di collegamento tra rappresentazioni visive sub-simboliche e rappresentazioni simboliche è stata implementata per la prima 9 Le Self-Organizing Maps sono un tipo di reti neurali artificiali ad apprendimento non suipervisionato in cui le informazioni sono rappresentate topologicamente come mappe a dimensionalità 2D o 3D. 10 Si tratta di reti neurali in cui i valori dello strato di output sono ottenuti da una combinazione lineare delle funzioni radiali di base dell'input e dei parametri della rete neurale (si veda Broomhead & Lowe 1988). 14 volta nell'architettura cognitiva proposta da Chella, Frixione e Gaglio (1997, 2003). In questa architettura, l'output di un sistema artificiale di riconoscimento visivo di oggetti viene connesso direttamente con una rappresentazione a spazi concettuali, la quale è a sua volta connessa con una rete semantica di tipo simbolico. La connessione tra spazi concettuali e rete simbolica viene ottenuta in parte mediante sistemi di mappatura manualmente costruiti (ad hoc look-up table; Chella et al. 2003), e in parte mediante un meccanismo di attenzione-selezione modellato da una rete neurale (time delay attractor neural network). Il primo tipo di connessione, invece, ovvero la relazione tra il sistema di riconoscimento visivo e gli spazi concettuali, viene istituita in modo del tutto automatico, ovvero senza l'intervento attivo del programmatore. In definitiva, lo sviluppo di modelli matematici computazionalmente trattabili di 'traduzione' neurale-vettoriale-geometrico rappresenta oggi una fervida area di ricerca nell'ambito delle scienze cognitive computazionali (Eliasmith et al. 2012). Recentemente, sono stati proposti ulteriori modellizzazioni della competenza lessicale basate sulle capacità di integrazione tra formati rappresentazionali eterogenei offerta dagli spazi concettuali. Ad esempio, DUAL PECCS (DUAL Prototype and Exemplars Based Conceptual Categorization System), proposto recentemente da uno dei due autori del presente saggio (Lieto et al. 2015; Lieto et al. 2017), è un sistema di elaborazione automatica del linguaggio naturale in cui sono integrati spazi concettali e ontologie basate su DL. A differenza dell'architettura cognitiva di Chella, Frixione e Gaglio (1997, 2003), in DUAL PECCS la connessione tra spazi concettuali e rappresentazioni simboliche è ottenuta in modo interamente automatico mediante la risorsa lingistica Wordnet, un noto database lessicale (Miller 1995). In DUAL PECCS, inoltre, la rappresentazioni a spazi concettuali viene sfruttrata ulterioremente per aumentare la capacità del sistema di modellare le prestazioni inferenziali umane, con particolare riferimento alla conoscenza prototipica e al ragionamento plausibile. L'odierna versione di questo modello, tuttavia, non è ancora integrata con un sistema di riconoscimento visivo che sfrutta formalismi basati su reti neurali, risultando in questo modo una modellizzazione ancora parziale (solo inferenziale, non referentiale) della competenza lessicale. Uno degli sviluppi futuri di DUAL PECCS consiste dunque nel tentare di operare tale integrazione inferenziale-referenziale, che potrà essere ottenuta esplorando o la direzione proposta da Chella, Frixione e Gaglio (1997, 2003), utilizzando cioè una rete di attenzione-selezione basata su time delay attractor o tecniche simili, o le direzioni proposte da Gardenfors e Balkenius, legate, rispettivamente, all'utilizzo di una Self-Organizing Maps o di reti basate su Radial Basis Function. A nostro parere, il sistema artificiale risultante potrebbe essere considerato un modello completo, benché indubbiamente molto semplificato, della competenza lessicale umana. Riferimenti bibliografici Andrews M, Vigliocco G, Vinson D. (2009). Integrating experiential and distributional data to learn semantic representations. Psychol Rev;116:463–98. Baader, F., Calvanese, D., McGuinness, D., Patel-Schneider, P., & Nardi, D. (Eds.). (2010). The description logic handbook: Theory, implementation and applications. Cambridge university press. Baader F, Hollunder B. (1995). Embedding defaults into terminological knowledge representation formalisms. J Autom Reasoning;14:149–80. doi:10.1007/BF00883932. Balkenius, C. (1999). Are there dimensions in the brain. Spinning ideas: Electronic essays dedicated to Peter Gärdenfors on his fiftieth birthday. Available at: http://www. lucs. lu. se/spinning/categories/cognitive/Balkenius/index. html [AC]. Baroni M., Lenci A. (2010). Distributional Memory: A General Framework for Corpus-Based Semantics. Computational Linguistics 2010;36:673–721. Baroni M. (2013) Composition in Distributional Semantics. Language and Linguistics Compass 300 References Chapter 3 2013;7. Besold, T. R., Garcez, A. D. A., Bader, S., Bowman, H., Domingos, P., Hitzler, P., ... & de Penning, L. (2017). Neuralsymbolic learning and reasoning: A survey and interpretation. arXiv preprint arXiv:1711.03902. 15 Binder, J. R., Desai, R. H., Graves, W. W., & Conant, L. L. (2009). Where is the semantic system? A critical review and meta-analysis of 120 functional neuroimaging studies. Cerebral Cortex (New York, N.Y.: 1991), 19(12), 2767–2796. Bookheimer, S. Y., Zeffiro, T. A., Blaxton, T. A., Gaillard, W. D., Malow, B., & Theodore, W. H. (1998). Regional cerebral blood flow during auditory responsive naming: evidence for crossmodality neural activation. Neuroreport, 9(10), 2409–2413. Bremer, M. (Ed.). (2005), Minds and Machines: 15. The description logic handbook. Cambridge: Cambridge University Press. Broomhead, D.S., Lowe, D. (1988). "Multi-variable functional interpolation and adaptive networks," Complex Systems, vol. 2, pp. 321-355. Calegari S, Ciucci D. (2007). Fuzzy Ontology, Fuzzy Description Logics and Fuzzy-OWL. In: Masulli F, Mitra S, Pasi G, editors. Applications of Fuzzy Sets Theory, Springer Berlin Heidelberg, p. 118–26. Calzavarini, F. (2017). Inferential and referential lexical semantic competence: A critical review of the supporting evidence. Journal of Neurolinguistics, Volume 44, Pages 163–189, https://doi.org/10.1016/j.jneuroling.2017.04.002 Calzavarini, F. (2018). La distinzione tra competenza inferenziale e referenziale: aspetti critici e nuove linee di ricerca. Sistemi intelligenti, 30(1), 59-82. Calzavarini, F. (2019). Brain and the Lexicon. The Neural Basis of Inferential and Referential Competence. Berlin: Springer. Campbell, R., Manning, L. (1996). Optic Aphasia: A Case with Spared Action Naming and Associated Disorders. Brain and Language, 53 (2), pp. 183-221. doi:10.1006/brln.1996.0044 Carnap, R. (1952). Meaning Postulates. Philosophical Studies, 3(5), 65–73. Chella, A., Frixione, M., Gaglio, S. (1997). A cognitive architecture for artificial vision. Artificial Intelligence, 89(1), 73–111. Chella, A., Frixione, M., Gaglio, S. (2003): Anchoring symbols to conceptual spaces: the case of dynamic scenarios. Robotics and Autonomous Systems, 43(2), 175–188. Chierchia, G., & McConnell-Ginet, S. (2000). Meaning and Grammar: An Introduction to Semantics. MIT Press. Collins, A., & Quillian, M. R. (1969). Retrieval time from semantic memory. San Diego: Academic Press. Collobert, R., & Weston, J. (2008). A unified architecture for natural language processing: Deep neural networks with multitask learning. In Proceedings of the 25th international conference on Machine learning (pp. 160167). ACM. Crouzet SM, Serre T. (2011). What are the visual features underlying rapid object recognition? Front Psychology 2011;2:326. doi:10.3389/fpsyg.2011.00326. Davidson, D. (1967). Truth and meaning. In Philosophy, Language, and Artificial Intelligence (pp. 93-111). Springer, Dordrecht. Eliasmith, C., Stewart, T.C., Choo, X., Bekolay, T., DeWolf, T., Tang, Y., Rasmussen, D. (2012). A large-scale model of the functioning brain. Science, 338(6111), 1202–1205. Elman, Jeffrey L. (1990). Finding Structure in Time. Cognitive Science. 14 (2): 179–211. Emerton, B. C., Gansler, D. A., Sandberg, E. H., & Jerram, M. (2014). Functional anatomic dissociation of description and picture naming in the left temporal lobe. Brain Imaging and Behavior, 8(4), 570–578. Everingham M, Gool LV, Williams CKI, Winn J, Zisserman A. (2009) The PASCAL Visual Object Classes (VOC) challenge. Farah, M. J. (2004). Visual agnosia (2nd ed.). Cambridge, Mass.; London: MIT Press. Forsyth, D. A., & Ponce, J. (2002). Computer vision: a modern approach. Prentice Hall. Frixione, M., & Lieto, A. (2011). Representing and reasoning on typicality in formal ontologies. In Proceedings of the 7th International Conference on Semantic Systems (pp. 119-125). ACM. Gärdenfors, P. (2000). Conceptual spaces: The geometry of thought. MIT press. Gardenfors, P. (2014). Conceptual spaces: The geometry of meaning. MIT press. Hamberger, M. J. (2015). Object naming in epilepsy and epilepsy surgery. Epilepsy & Behavior: E&B. Hamberger, M. J., Goodman, R. R., Perrine, K., & Tamny, T. (2001). Anatomic dissociation of auditory and visual naming in the lateral temporal cortex. Neurology, 56(1), 56–61. Harnad, S. (1990). The symbol grounding problem. Philosophical Explorations, 42, 335e346. Hearst MA. (1992). Automatic Acquisition of Hyponyms from Large Text Corpora. In Proceedings of the 14th International Conference on Computational Linguistics, p. 539–45. Heilman, K. M., Rothi, L., McFarling, D., & Rottmann, A. L. (1981). Transcortical sensory aphasia with relatively spared spontaneous speech and naming. Archives of Neurology, 38(4), 236e239. Hillis, A.E., Caramazza, A. (1995). Cognitive and Neural Mechanisms Underlying Visual and Semantic Processing: Implications From «optic Aphasia ». Journal of Cognitive Neuroscience, 7 (4), pp. 457-478. doi:10.1162/jocn.1995.7.4.457. Jackendoff R. (1985). Semantics and cognition. 1st paperback ed. Cambridge, Mass.: MIT Press. Kremin, H. (1986). Spared naming without comprehension. Journal of Neurolinguistics, 2(1–2), 131–150. Israel, D. J. (1983). Interpreting network formalisms. Computers & Mathematics with Applications, 9(1), 1-13. 16 Landauer, T. K., & Dumais, S. T. (1997). A solution to Plato's problem: The latent semantic analysis theory of acquisition, induction, and representation of knowledge. Psychological review, 104(2), 211. Larson, R.K., Segal, G. (1995). Knowledge of meaning: An introduction to semantic theory. Mit Press Cambridge, MA LeCun, Y., Bengio, Y., Hinton, G. (2015). Deep learning. Nature, 521(7553), 436–444. Lenci A. (2008). Distributional semantics in linguistic and cognitive research. Italian Journal of Linguistics;20. Lepore, E., & Ludwig, K. (2007). Donald Davidson's Truth-Theoretic Semantics. Clarendon Press. Lieto, A. (2013). Un approccio cognitivo alla rappresentazione dei concetti nelle ontologie formali. Sistemi intelligenti, 25(2), 211-228. Lieto, A., Radicioni, D.P., Rho, V. (2015). A common-sense conceptual categorization system integrating heterogeneous proxytypes and the dual process of reasoning. In Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI),Buenos Aires, AAAI Press, pp. 875–881. Lieto, A., Radicioni, D. P., & Rho, V. (2017). Dual PECCS: a cognitive system for conceptual representation and categorization. Journal of Experimental & Theoretical Artificial Intelligence, 29(2), 433-452. Lieto, A., Lebiere, C., & Oltramari, A. (2018). The knowledge level in cognitive architectures: Current limitations and possible developments. Cognitive Systems Research, 48, 39-55. Lukasiewicz T, Straccia U. (2007). Managing Uncertainty and Vagueness in Description Logics for the Semantic Web. Mack ML, Palmeri TJ. (2011). The timing of visual object categorization. Front Psychol;2:165. doi:10.3389/fpsyg.2011.00165. Marconi, D. (1999). La competenza lessicale. Roma: Laterza.. Marconi, D., Manenti, R., Catricalà, E., Della Rosa, P. A., Siri, S., & Cappa, S. F. (2013). The neural substrates of inferential and referential semantic processing. Cortex; a Journal Devoted to the Study of the Nervous System and Behavior, 49(8), 2055–2066. Marr D, Nishihara HK. (1978). Representation and Recognition of the Spatial Organization of Three-Dimensional Shapes. Proceedings of the Royal Society of London B: Biological Sciences;200:269. McCarthy, J. (1958). Recursive Functions of Symbolic Expressions and Their Computation by Machine. Meini, C., & Paternoster, A. (1996). Understanding language through vision. In Integration of natural language and Vision Processing (pp. 139-150). Springer, Dordrecht. Mestres-Missé, A., Münte, T. F., & Rodriguez-Fornells, A. (2009). Functional neuroanatomy of contextual acquisition of concrete and abstract words. Journal of Cognitive Neuroscience, 21(11), 2154–2171. Minsky, M. (1975). A Framework for Representing Knowledge, in P. Winston (Ed.) The Psychology of Computer Vision, (New York: McGraw-Hill), 211-277. Mikolov, T., Sutskever, I., Chen, K., Corrado, G. S., & Dean, J. (2013). Distributed representations of words and phrases and their compositionality. In Advances in neural information processing systems (pp. 31113119). Montague, R. (1974). Formal Philosophy: Selected Papers, RH Thomason, Ed. Nagel, H. H. (2004). Steps toward a cognitive vision system. AI magazine, 25(2), 31-31. Nistér D, Stewénius (2006) H. Scalable Recognition with a Vocabulary Tree. IN CVPR, p. 2161–8. Partee, B. H. (1980). Montague Grammar, Mental Representations, and Reality. In S. Kanger & S. Ōhman (Eds.), Philosophy and Grammar (pp. 59–78). Dordrecht: Springer Netherlands. Paternoster, A. (2001). Linguaggio e visione. ETS. Rogers TT. (2008). Computational Models of Semantic Memory. The Cambridge Handbook of Computational Psychology, Cambridge University Press. Searle, J. R. (1980). Minds, brains and programs. Behavioral and Brain Sciences, 3(3), 417e457. Shuren, J., Geldmacher, D., & Heilman, K. M. (1993). Nonoptic aphasia: Aphasia with preserved confrontation naming in Alzheimer's disease. Neurology, 43(10), 1900e1907. Siciliano B, Khatib O. (2008). Springer handbook of robotics. Berlin ; London: Springer. Strasser, Christian and Antonelli, G. Aldo, "Non-monotonic Logic", The Stanford Encyclopedia of Philosophy (Summer 2019 Edition), Edward N. Zalta (ed.), URL = <https://plato.stanford.edu/archives/sum2019/entries/logicnonmonotonic/>. Tomaszewki Farias, S., Harrington, G., Broomand, C., & Seyal, M. (2005). Differences in functional MR imaging activation patterns associated with confrontation naming and responsive naming. AJNR. American Journal of Neuroradiology, 26(10), 2492–2499. Turney PD. Similarity of semantic relations. Computational Linguistics 2006:379–416 Zenker, F., Gärdenfors, P. (2015) Applications of conceptual spaces The case for geometricknowledge representation. Springer.