Primo modello di intelligenza artificiale per ricostruire testi antichi

La nascita della scrittura segnò l’alba della Storia ed è fondamentale per la nostra comprensione delle civiltà del passato come del mondo in cui viviamo oggi. Per esempio, oltre 2.500 anni fa, i Greci iniziarono a scrivere su pietra, ceramica e metallo per documentare tutto da locazioni e leggi a calendari e oracoli, fornendo una panoramica dettagliata sull’area mediterranea.

Sfortunatamente, tale racconto è incompleto. Nel corso dei secoli, moltissime iscrizioni del mondo antico sono state danneggiate e parti del loro testo sono ora perdute o illeggibili, possono essere state trasportate lontano dalla loro ubicazione originaria, e la loro datazione è incerta. Le moderne tecniche di datazione come quella al radiocarbonio, infatti, non possono essere usate su questi materiali, rendendo le iscrizioni difficili e laboriose da interpretare.

Oggi, il Dipartimento di Studi Umanistici di Ca' Foscari, assieme a DeepMind, la Faculty of Classics dell'Università di Oxford, ed il Dipartimento di Informatica dell'Università AUEB di Atene presentano Ithaca.

Ithaca, che prende il nome dall'isola greca nell'Odissea di Omero, è il primo modello di intelligenza artificiale (deep learning) che può aiutare studiose e studiosi a ricostruire le parti mancanti di testi antichi, a datarli ed a identificare il loro luogo di scrittura originale. Il sistema è addestrato sul più grande database digitale di iscrizioni greche del Packard Humanities Institute. La ricerca è stata pubblicata dalla rivista scientifica Nature.

Il modello è stato progettato per massimizzare il potenziale collaborativo tra l’intelligenza artificiale e gli storici che studiano questi testi. Mentre Ithaca è capace di integrare le lacune testuali con una precisione del 62%, quando gli studiosi combinano la propria conoscenza storica con l'input di Ithaca, la loro performance sale dal 25% al 72%.

Ithaca può anche attribuire iscrizioni alla loro ubicazione originaria con una precisione del 71% e datarle a meno di 30 anni dalle date proposte dagli storici.

Ithaca è già stato utilizzato per dibattiti metodologici attuali nello studio della storia greca, per esempio sulla datazione controversa di una serie di importanti decreti ateniesi ritenuti antecedenti al 446/445 a.C. Studi recenti suggeriscono invece che questi documenti siano stati scritti intorno al 420 a.C. È straordinario che Ithaca preveda per questi decreti una data media del 421 a.C., allineandosi dunque con i più recenti progressi nella disciplina e dimostrando come l’intelligenza artificiale possa contribuire ai dibattiti storici correnti.

"Nonostante possa sembrare una differenza di solo qualche anno, ridatare questi testi ha implicazioni importanti per la nostra comprensione della storia politica di Atene nell’età classica", afferma Thea Sommerschield, Marie Curie Fellow a Ca' Foscari e ricercatrice presso il CHS dell'Università di Harvard. "Speriamo che modelli come Ithaca possano inaugurare una nuova stagione di ricerca collaborativa fra intelligenza artificiale e discipline umanistiche, rivoluzionando il modo in cui studiamo e scriviamo la storia di alcuni dei periodi più significativi nell’umanità".

"Riteniamo che nuovi modelli di machine learning come Ithaca possano aiutare studiose e studiosi ad espandere e approfondire la nostra comprensione della storia antica, proprio come i microscopi e i telescopi hanno avanzato le scienze", ha affermato Yannis Assael, ricercatore a DeepMind. "L'antica Grecia gioca un ruolo fondamentale nella nostra comprensione del mondo Mediterraneo antico, ma è solo una parte di un vasto mosaico di culture scritte che possiamo esplorare".

Il team sta attualmente lavorando su versioni di Ithaca addestrate su altre lingue antiche. L’architettura di Ithaca può già essere utilizzata da ricercatori per studiare altri sistemi di scrittura, dall’accadico al demotico, dall’ebraico alle lingue maya, allenando nuovi modelli sui propri dati.

Per rendere la ricerca facilmente accessibile a ricercatori, educatori, personale museale e altri, DeepMind ha collaborato con Google Cloud e Google Arts & Culture per creare una versione interattiva e libera di Ithaca. Per avanzare ulteriormente la ricerca, hanno anche reso open source il modello e il codice di programmazione.

Thea Sommerschield è una Marie Skłodowska-Curie fellow a Ca’ Foscari, ed Ithaca è il primo output del suo progetto PythiaPlus finanziato dal progetto Horizon 2020 dell’Unione Europea.

Tiziana Lippiello, Rettrice di Ca’ Foscari Università di Venezia, afferma: “E' davvero un bel risultato per i nostri studi umanistici. Il carattere innovativo di questo progetto evidenzia l'approccio della ricerca scientifica di Ca' Foscari: l'apertura internazionale e l'interdisciplinarità. Le mie congratulazioni al team di ricercatrici e ricercatori per questo importante contributo che unisce le discipline umanistiche e l'intelligenza artificiale e consente la diffusione di conoscenze e attività di collaborazione di alto profilo che Ca' Foscari continuerà a sostenere per alimentare questa nuova frontiera della ricerca.”

Lorenzo Calvelli, Professore di Storia Romana, Dipartimento di Studi Umanistici, aggiunge: “Grazie ad Ithaca, le culture epigrafiche del mondo antico possono finalmente essere studiate con nuove tecnologie. L'applicazione dell'Intelligenza Artificiale allo studio di centinaia di migliaia di iscrizioni ci consentirà di confrontare, studiare ed integrare questi testi ben oltre le possibilità di qualsiasi mente umana. Sono entusiasta di far parte di un progetto interdisciplinare che unisce specialisti di machine learning ed esperti della lunga tradizione accademica umanistica.”