Il rapporto fra scienza e letteratura in un innovativo progetto PCTO sul tema dell’analisi semantica, raccontato in un’intervista a tre voci

Lucia Magno
Insegnante di discipline letterarie, latino e greco, Liceo Classico Mameli di Roma

Sara Zuzzi
Insegnante di matematica e fisica, Liceo Classico Mameli di Roma

Mario Santoro
Ricercatore presso IAC-CNR di Roma

Gentili Professoresse e Gentile Ricercatore,

grazie per la vostra disponibilità. Vogliamo approfondire con voi il tema del progetto PCTO “Analisi semantica dei testi con algoritmi di language e topic model del Liceo Classico Goffredo Mameli di Roma, a cui Piazza Copernico sta partecipando con il suo settore R&S. Vogliamo comprendere con voi non solo cosa si farà nel progetto appena avviato, ma anche le esigenze che nella vostra scuola sono state identificate, e le motivazioni che vi hanno condotto a scegliere l’analisi semantica come tema oggetto del PCTO.

Per iniziare potete raccontarci quali sono gli obiettivi che deve perseguire un PCTO?

L’obiettivo di un PCTO, in base alle linee guida pubblicate dal Ministero dell’istruzione con il Decreto del 4 settembre 2019 n. 774, è promuovere percorsi formativi che indirizzino gli studenti nel mondo del lavoro e che, offrendo loro la possibilità di interagire con figure professionali esperte, orientino i loro interessi, favorendo lo sviluppo delle loro abilità e competenze.

Lo studente liceale, impegnato nel secondo biennio e nel quinto anno a scegliere uno o più percorsi predisposti dalla scuola, ha così un duplice compito, quello di apprendere da persone che hanno competenze in un settore lavorativo particolare, acquisendo nuove conoscenze e quello di mettere in pratica gli insegnamenti ricevuti, sviluppando competenze trasversali.

Se da un lato, infatti, è chiamato a partecipare a lezioni frontali e/o laboratoriali, ad assistere ad attività legate a specifici settori lavorativi e a conoscere da vicino i luoghi in cui  le relative professioni si esplicano, dall’altra deve dimostrare quanto ha imparato  traducendo la sua esperienza conoscitiva in una o più attività progettuali a lui assegnate in itinere e/o alla fine del percorso (pratiche o teoriche) di cui è protagonista e che saranno oggetto di discussione all’esame di maturità. È chiaro, dunque, che in un quadro più ampio che individua le finalità dell’esperienza, un percorso così concepito mira in generale a rafforzare l’autonomia, la motivazione, la consapevolezza e la sicurezza dello studente e contribuisce a formarlo come cittadino responsabile.

Una recente possibilità, che  risale alla riforma Moratti art. 4 L 53/2003, ha, inoltre, permesso di organizzare tali percorsi “sotto la responsabilità dell’istituzione scolastica o formativa, sulla base di convenzioni con imprese o con le rispettive associazioni di rappresentanza o con le camere di commercio, industria, artigianato e agricoltura, o con enti pubblici e privati ivi inclusi quelli del terzo settore, disponibili ad accogliere gli studenti per periodi di tirocinio che non costituiscono rapporto individuale di lavoro”.

Diverse scuole -soprattutto in questi ultimi anni –hanno colto questa occasione come un’opportunità importante per accrescere l’efficacia di tali percorsi e conferire loro più alto valore: con il coinvolgimento diretto dell’istituzione scolastica è possibile infatti seguire da vicino gli studenti e motivarli promuovendo percorsi che abbiano reale pertinenza con le materie di indirizzo e gli argomenti di studio affrontati, costruendo una proposta integrata e sinergica tra la scuola, il mondo della ricerca e del lavoro. È il nostro caso: è l’esperienza che abbiamo costruito insieme noi docenti di lettere e di matematica del liceo Mameli in collaborazione con il CNR e l’azienda Piazza Copernico.

Raccontiamo in poche ma significative parole l’obiettivo del vostro PCTO e la tematica scelta.

Avendo consolidato nel tempo molti diversi tipi di analisi sulla semantica, che sono attualmente implementati in Semanticase, nel 2021 abbiamo voluto indagare meglio le strutture logiche tra i topic.

Ci interessava arrivare a comprendere meglio le relazioni tra i topic, non solo in termini gerarchici, ma di relazioni e connessioni. Poter individuare i topic che relazionano cluster tematici diversi o che accentrano diversi topic, significa avere una vista interessante sui nuclei concettuali fondamentali e imprescindibili di un insieme di testi.

Abbiamo ritenuto essenziale questo studio per comprendere sempre più a fondo le tematiche analizzate da Semanticase.

Nel promuovere il  PCTO Analisi semantica dei testi con algoritmi di language e topic model,  la Prof. Zuzzi ed io ci siamo prefissate un obiettivo principale: mostrare ai nostri alunni di terza E come le materie umanistiche – nel caso specifico la letteratura italiana – e le materie scientifiche – nel caso specifico matematica – possano dialogare insieme e anzi, come l’una possa essere chiamata a supporto dell’altra in una ricerca che tenda nella stessa direzione.

La ricerca in questione ha come oggetto di interesse lo studio delle parole nella loro autenticità di significante, nella loro varietà di significato, all’interno di un sistema di relazioni che le condizionano a partire dai diversi contesti (ovvero i testi di appartenenza). Nello specifico abbiamo scelto di analizzare le “parole” della letteratura di fine Ottocento inizi Novecento, in particolare le parole usate da Luigi Pirandello, Federigo Tozzi e  Grazia Deledda.

I ragazzi sono chiamati, così, a conoscere autori di letteratura che affronteranno con puntualità durante il quinto anno di studi, e a lavorare preliminarmente ad un’analisi semantica tradizionale di testi scelti (romanzi e racconti) presi a modello per individuare le linee principali della poetica degli autori in questione.  Entra poi in gioco la matematica: i dati testuali presi a riferimento vengono elaborati da algoritmi di semantica utilizzando la dashboard grafica Semanticase, nata da una collaborazione del CNR con l’area ricerca e sviluppo di Piazza Copernico.

Ritengo fondamentale che gli studenti capiscano che fuori dalla scuola, nel mondo della ricerca e del lavoro, la divisione tra le discipline è molto sfumata, le competenze scientifiche ed umanistiche si integrano per costruire strumenti, idee e conoscenza.  L’idea di effettuare con un PCTO un’indagine quantitativa e grafica sull’analisi semantica dei testi, una modalità molto lontana dal mondo della scuola, è venuta fuori proprio perché il concetto del testo come dato è uno strumento sempre più presente in modo trasversale nel mondo della ricerca e del lavoro (nella gestione dei reclami delle aziende, nel marketing, nella ricerca linguistica, ecc.). Credo che i ragazzi debbano uscire dalla scuola superiore di II grado con conoscenze, anche se solo di base, su alcune delle nuove tecnologie, sapendo utilizzarle e interpretarle in modo consapevole e con spirito critico.

Voi siete insegnanti di materie letterarie e materie scientifiche in un Liceo Classico, e nel PCTO trattate il tema della semantica e dell’intelligenza artificiale. Cosa è importante che i ragazzi della generazione Z comprendano dell’evoluzione della comunicazione digitale?

L’idea è quella di concentrarsi sull’innovazione in atto nell’analisi dei testi digitali. L’enorme creazione e scambio di testo, che avviene ogni giorno da fonti eterogenee, ha reso necessario definire nuovi approcci per la comprensione del contenuto, della sua specifica semantica, rilevandone omogeneità/disomogeneità per diversi gruppi. A tal fine in questo percorso si introducono, senza formalismo matematico, i concetti di language e topic model presenti negli algoritmi di analisi di dati testuali, mettendo l’accento sulla comprensione dei risultati espressi tramite diverse rappresentazioni grafiche. Inoltre, è fondamentale far comprendere ai ragazzi che anche qui, come in ogni modello, è necessario fare delle scelte in base al contesto che si sta analizzando; non c’è semplicemente spingi il bottone ed ottieni l’analisi. Tali scelte vengono fatte dagli esperti nel campo scientifico e letterario che lavorano in sinergia tra loro. Per fare un esempio, nel primo incontro del PCTO abbiamo analizzato con Semanticase un racconto umoristico di Anton Cechov (Lo specchio deformante), impostando volutamente nell’algoritmo una scelta non idonea, cioè il calcolo del Sentiment (variabile binaria positivo/negativo). Questa opzione di analisi binaria non era la più opportuna nel contesto di questo racconto, perché l’umorismo ha bisogno di più sfumature e non basta una semplice Sentiment positiva/negativa a definirlo. Cambiando contesto e guardando all’ambito dei reclami delle aziende, come prima fotografia del testo, la scelta della Sentiment è molto utilizzata per comprendere velocemente se i clienti parlano positivamente o negativamente del servizio. Quindi la sinergia tra gli esperti per capire il contesto e quale scelta fare è alla base di ogni buona analisi.

L’analisi digitale inevitabilmente rovescia il sistema di regole che siamo abituati a seguire quando riflettiamo su un testo. A scuola insegniamo ai nostri alunni a compiere un’analisi linguistica di un testo solo dopo averlo letto, contestualizzato e compreso (decodificato). Riflettiamo dunque su un testo noto e individuiamo le parole chiave e gli ambiti semantici di riferimento, analizziamo le categorie narratologiche e le scelte stilistiche che legano il piano dei contenuti e quello della forma; indaghiamo sulle relazioni che intercorrono fra gli elementi interni al testo stesso (analisi intratestuale), che poniamo poi in relazione con altri testi dell’autore o di altri autori (analisi intertestuale). L’analisi degli elementi linguistici e stilistici è fondamentale per comprendere i valori e la realtà che l’autore intende rappresentare nella sua opera, perciò non possiamo fare a meno di leggere, leggere, leggere se vogliamo comprendere veramente. Ma quando i testi sono davvero tanti e non abbiamo il tempo e la possibilità di leggerli tutti, la matematica può venirci in aiuto e suggerirci, a partire da richieste ben formulate, come indirizzare la nostra ricerca, quali strumenti di analisi privilegiare, quali passi dei testi presi a riferimento prendere in considerazione rispetto al tipo di indagine che si intende condurre, come approdare a riflessioni di valore tanto di contenuto tanto di forma. Ecco, questo è quel che vogliamo far comprendere ai nostri alunni.

Digital skills a scuola, comprensione dei significati nei testi, innovazione e intelligenza artificiale, attività laboratoriale e cooperativa, tanti sono gli ingredienti del progetto “Analisi semantica dei testi con algoritmi di language e topic model”. Quale vi aspettate sarà il fattore principale per il coinvolgimento attivo dei ragazzi? E quali gli obiettivi di apprendimento da cogliere e quale il valore specifico di questa esperienza?

Io e la Prof. Zuzzi lavoriamo ormai insieme da diversi anni. Ci siamo conosciute al Mameli e in questo liceo abbiamo costruito per i nostri alunni diversi progetti interdisciplinari in cui hanno dialogato la matematica, la statistica, la letteratura italiana, l’educazione civica e anche il latino e il greco. Crediamo in una didattica che attribuisce agli alunni un ruolo attivo, che li chiama ad essere consapevoli del processo conoscitivo messo in atto e li rende protagonisti del percorso di apprendimento. Insomma crediamo in una didattica che stimola a conquistare autonomamente le competenze, oggi sicuramente più numerose e complesse, tenendo conto della complessità del nostro mondo del lavoro. Pianifichiamo così le attività solo per grandi linee e costruiamo i nostri percorsi progressivamente, rivolgendo attenzione estrema alle esigenze che emergono di volta in volta dal contesto di lavoro perlopiù cooperativo e laboratoriale e alle richieste dei singoli studenti.

Vincente per il coinvolgimento attivo dei ragazzi è il ricorso a strumenti digitali/multimediali per l’analisi dei testi, la comunicazione e divulgazione del metodo e dei risultati. L’educazione oggi non può prescindere dalla tecnologia e dalla diffusione dei dispositivi: il ricorso agli strumenti digitali e dunque ad una didattica sperimentale che parla la lingua dei nostri studenti garantisce la riuscita di un progetto e ci permette di offrire degli esempi concreti di come gli strumenti digitali possano essere usati in modo attivo, con intelligenza e in modo proficuo.

Per il confronto e l’analisi tradizionale dei testi abbiamo ad esempio deciso di privilegiare l’attività del Social Reading, una pratica di lettura condivisa che permette al docente di leggere insieme agli studenti un testo digitale, di commentarlo, di analizzarne parole chiave e campi semantici, secondo le dinamiche di interazione e comunicazione tipiche dei social network.

Inoltre, per comunicare i risultati della nostra ricerca gli strumenti utilizzati sono quelli multimediali del blog, del  forum di discussione e della pagina web.

I concetti e gli strumenti emersi in ambito digitale e di data science/machine learning/AI, sono oggi applicabili trasversalmente in contesti sempre nuovi: scienze sociali e linguistiche, scienze della comunicazione ed umanistiche, economia e management, rappresentano strumenti effettivi di innovazione e miglioramento del lavoro.  Ci proponiamo dunque di guidare i nostri studenti verso l’abitudine a queste nuove tecniche con un uso consapevole e con spirito critico, approfondendo i concetti sottostanti e i vari contesti di applicazione.

La scelta in ambito scolastico di un contesto laboratoriale e cooperativo è ormai necessaria. Negli ultimi anni le ricerche sia psicologiche sia neuroscientifiche hanno permesso di capire sempre meglio che l’apprendimento è un’esperienza anzitutto sociale, dove l’interazione con gli altri e il fare gruppo rappresentano l’elemento prioritario. Il lavoro di gruppo è più efficace grazie all’interazione continua tra pari, poiché si produce un effetto full immersion.  Posso citare alcuni tra i tanti libri scritti da pedagogisti ed esperti del settore che centrano tale concetto: “In gruppo si impara. Apprendimento cooperativo e personalizzato dei processi didattici” di Mario Martinelli (Ed. SEI collana Scuola e Vita, 2004) e “Con gli altri imparo” di Daniele Novara e Elena Passerini (Ed. Centro Studi Erickson, 2015).

La classe coinvolta nel progetto è un terzo anno del Liceo Classico. Come mai questa scelta?

La classe terza E è una classe con cui lavoriamo da tre anni: sono giovani entusiasti, desiderosi di apprendere, pronti sempre ad accogliere nuove sfide e a mettersi in gioco. Non abbiamo dunque avuto alcuna esitazione a coinvolgerli nel nostro progetto: sapevamo bene che per Viola, Angela e Giorgia sarebbe stato uno stimolo ad uscire dal guscio e a sostenere senza paura le proprie idee; per Nicola, Giovanni, Claudio e Ludovica  per spronarli a costruire un pensiero critico sia a livello letterario che tecnologico;  in generale per tutti un’occasione per comprendere che la matematica è utile per cose che nemmeno immaginano.

La scelta poi di approfondire la letteratura del primo Novecento, con particolare riferimento allo sviluppo della narrativa nella forma della novella, del racconto e del romanzo, non è stata casuale. Il programma di letteratura italiana è talmente vasto che spesso non si riescono a trattare in modo esaustivo argomenti che proprio per la loro vicinanza a noi appaiono davvero attuali e attraggono in modo spontaneo i nostri alunni, stimolandoli a riflessioni critiche di valore. A partire dal terzo anno, dunque, soprattutto se si ha la possibilità di lavorare con studenti motivati e impegnati – e questo è il nostro caso – è bene proporre, parallelamente agli argomenti indicati dai programmi ministeriali, percorsi  formativi che li stimolino al ragionamento, all’auto riflessione, all’elaborazione di strumenti di indagine personali, per affrontare la realtà che li circonda con maggiore consapevolezza. E ben venga il confronto anche con colleghi di altre discipline quali la storia e la filosofia -che ci permettono di costruire un dialogo più articolato.

Inoltre dal punto di vista scientifico il senso di portare avanti questo percorso in un terzo anno del Liceo classico in cui i ragazzi da un anno si confrontano con le funzioni e da pochi mesi hanno iniziato a studiare fisica, sta nell’introdurre il concetto di modello per rappresentare un fenomeno diverso da quelli tradizionalmente descritti dalla matematica, in cui il testo è un dato e venire così a contatto con argomenti innovativi propri del mondo della ricerca e del lavoro, per iniziare ad avere una maggior consapevolezza nella scelta universitaria.

Questo progetto prevede un interessante coinvolgimento di un Organismo di ricerca come un istituto del CNR di Roma. Come questa esperienza può contribuire ad arricchire l’esperienza di un liceo classico. E come questa iniziativa contribuisce alla progettualità dell’istituto sulla Curvatura digitale?

Sull’importanza di far dialogare mondo della ricerca e scuola mi sono già espressa ampiamente. Per quanto riguarda la proposta formativa di Curvatura digitale nel liceo classico, che la nostra scuola ha voluto introdurre per il prossimo anno scolastico, il PCTO di Analisi semantica dei testi sarà un modulo attuato al terzo anno: questo percorso è soltanto un progetto pilota.

Il modo in cui produciamo e conserviamo i testi è fortemente cambiato negli ultimi anni. Uno spazio piccolissimo come quello di un Hard Disk può oggi contenere migliaia di testi che fino a poche decine di anni fa erano contenibili solo in una biblioteca. Siamo ormai tutti abituati senza problemi ad avere una biblioteca nel palmo della mano. Viceversa il nostro modo di approcciarci ai testi non è cambiato moltissimo: li processiamo ‘uno ad uno’ usando il computer solo per cercare velocemente parole che conosciamo a mo’ di glossario. Questo approccio, che culturalmente abbiamo da secoli, è di tipo bottom-up: parto dal singolo testo, lo sintetizzo, confronto le sintesi. In un mondo che invece produce quantità enormi di testi sta diventando sempre più importante cambiare paradigma con un approccio di tipo top-down. Esamino un corpus di testi tramite l’ausilio di algoritmi che ne effettuano una sintesi non bias, approfondisco gli argomenti andando a leggere ah hoc alcuni testi o parti di essi (scelti in base all’analisi fatta sopra), utilizzo la sintesi ottenuta per operare un confronto e indagare in ultimo i singoli testi. Si evince che questo tipo di approccio, mantenendo intatti gli strumenti di esegesi letteraria tipici del liceo classico, proietta gli studenti e le studentesse nel futuro, in un mondo in cui l’analisi letteraria sfrutta totalmente le risorse tecnologiche governandole, e non venendo schiacciata o rifugiandosi in anfratti di conservatorismo fine a se stesso.

Quali sono i temi di innovazione che verranno trattati nel corso del PCTO e perché secondo voi costituiscono temi rilevanti nella preparazione degli studenti anche nei percorsi umanistici?

Affrontiamo in maniera tecnica e non dettagliata diversi punti di innovazione in ambito umanistico. Cominciamo con ordine:

  • L’uso di questi strumenti permette di pensare al nostro approccio al testo e alla sua interpretazione. La riflessione su quale modello sia meglio usare e sui risultati attesi, induce a una discussione sulle sovrastrutture inevitabilmente presenti quando si fa analisi di testi. Questa riflessione rappresenta un’innovazione nell’approccio ai dati testuali ed alla loro analisi soprattutto in ambito letterario.
  • È prassi nell’esegesi dei testi partire con un approccio bottom-up: si analizza testo per testo per poi cercare un filo che unisca i diversi testi. Alcuni algoritmi di semantica, come ad esempio il topic modeling, hanno invece un approccio top-down: si parte dalla sintesi del corpus oggetto di studio per poi declinarla nei vari testi. Anche questa è un’innovazione che permette di avere meno bias legati a scelte soggettive.
  • Algoritmi di semantica permettono di verificare la similarità tra frasi; ciò induce, individuate alcune frasi rappresentative di un testo, a confrontarle con le frasi di altri testi dello stesso autore o di altri autori. Questo è un tipo di approccio totalmente innovativo.
Quale ruolo svolgerà Piazza Copernico nel progetto? E come l’esperienza di un’azienda può essere effettivamente utile ai ragazzi per comprendere come orientare il proprio percorso di studi?

La nostra idea centrale in questo PCTO è l’interazione ed il dialogo. L’interazione, come abbiamo più volte ripetuto, è tra le materie scientifiche e letterarie, tra i ragazzi con il lavoro cooperativo e laboratoriale, ma è anche tra la scuola, il mondo della ricerca e del lavoro. L’idea è far comprendere ai nostri alunni che dietro ogni strumento tecnologico c’è un modello e uno studio dove vari “mondi” (discipline) si parlano per ottenere un prodotto ed una applicabilità.

Piazza Copernico ha un triplice ruolo:

  • mettere a disposizione il prodotto Semanticase;
  • far comprendere come si utilizza l’analisi semantica dei testi nell’ambito aziendale;
  • focalizzare l’attenzione su un fondamentale concetto, la comunicazione, dando ai ragazzi gli strumenti per costruire un prodotto finale di divulgazione del progetto.