16
Apr
Il grande pubblico si è trovato a ragionare freneticamente di intelligenza artificiale solo quando alcuni motori di ricerca hanno messo gratuitamente a disposizione dell’utenza di massa software di IA generativa, a dire il vero poco potenti e assai limitati rispetto a quelli che, già da tempo, vengono usati nell’industria tecnologica. Eccessive preoccupazioni e scenarî apocalittici ingigantiscono la questione, fino a ipotizzare situazioni distopiche degne di una sceneggiatura americana. Per il momento, ci sembrano del tutto fuori luogo, oltre che tardive. Nondimeno, lo sviluppo delle intelligenze artificiali impone riflessioni critiche. Qui ci occuperemo di alcuni problemi che la recente introduzione di questi software ha fatto emergere nel campo degli studi umanistici, in ottica di tutela e promozione delle peculiari-tà nazionali.
L’informatica per gli studî umanistici – o come si preferisce, digital humanities – è un campo che, a onta della presunta e infondata idea di arretratezza italiana, vanta una storia e gloria. I primi progetti rudimentali riguardavano gli archivî di ricerca (searchable databases) in grado di raccogliere enormi corpora la-tini e greci, dall’antichità ai giorni nostri, consentendo la ricerca di passi e occorrenze di parole. Si trat-tava di antichità rispetto alle tecnologie odierne (1), il cui utilizzo è ormai imprescindibile, soprattutto nell’ambito del commento letterario e filologico, per la compilazione di quello che un tempo si definiva apparatus fontium (2).
Siamo stati personalmente testimoni dell’addestramento di un software basato sul machine learning, specializzato in riconoscimento del testo scritto (Handwritten Text Recognition o HTR). Si tratta della “semplice” evoluzione dei software di lettura ottica di caratteri (Optical Character Recognition o OCR) con cui, a dispetto del nome altisonante, tutti abbiamo a che fare quasi quotidianamente. Per esempio, quan-do copiamo il testo da un file pdf contenente la scansione di un libro. In casi banali come questo, i computer casalinghi sono perfettamente in grado di effettuare un discreto lavoro; in altri, occorrono software specifici, ma non troppo costosi, diffusi soprattutto nel mondo dell’editoria. Invece, per i libri a stampa più datati, come le edizioni settecentesche di testi greci con caratteri piuttosto eclettici, occorro-no singoli training sets. Per apprendere la lettura di tipologie testuali complesse, si ricorre a strumenti sempre più sofisticati, che richiedono specifico allenamento, fino all’HTR per leggere i testi manoscritti, finora accessibili solo a studiosi dotati di competenze paleografiche.
Qui viene al pettine la contraddizione.
La quantità di lavoro umano necessaria per insegnare a una macchina a leggere anche le righe più semplici richiede dozzine di ore di trascrizione manuale e mappatura delle singole pagine del manoscritto. Ciò solo per ottenere una corretta identificazione della “sequenza di macchie d’inchiostro”. Almeno il doppio del lavoro è necessario per testare e correggere la macchina quando essa prova in autonomia a leggere i caratteri non trascritti tradizionalmente. Questo ingente impegno servirebbe, se non per ogni singolo codice, per ogni diversa mano o almeno per ogni diverso stile scrittorio di ogni lingua conosciuta. Un’operazione che, effettuata manualmente, è tutt’ora assai più veloce (3).
Questa piccola esperienza, da una tecnologia tanto banale come i database fino alle ricerche automatiche più avanzate, unita alle disavventure che abbiamo racchiuso in nota per brevità, inquadra bene il rischio maggiore dello scenario attuale: la qualità intrinseca di questi strumenti non dovrebbe preoccuparci quanto l’insipienza e la mancanza di creatività – guidata dalla preparazione culturale – di chi le utilizza. Poiché i software di IA non sono che aggregatori di dati dotati di straordinaria velocità di anali-si, si può ben intuire quanto lavoro meccanico – magari, come insinuano le malelingue, sottopagato in qualche succursale del Terzo Mondo – sia stato svolto per fornire i data imput necessari allo svolgimento di attività semplici quali quelle svolte dalle IA generative open access di oggi.
In conclusione. Il lavoro culturale svolto direttamente dall’uomo, soprattutto quello ad elevata specializzazione, non verrà mai meno. Abbiamo usato il caso specifico della filologia solo come esempio di disciplina le cui operazioni complesse, quali la trascrizione e collazione di opere manoscritte, è assai improbabile possano essere compilate autonomamente, anche nel futuro remoto, da una macchina. La parte “meccanica” del lavoro di un filologo non è che la premessa al resto della sua attività intellettuale, che dovrebbe richiedere anzitutto doti di creatività e intuito, che nessuna macchina sarà mai in grado di replicare. L’HTR e qualsiasi altro strumento che le nuove tecnologie permetteranno di sviluppare sono, appunto, strumenti, non diversi nella loro concezione da un dizionario o da una tabula abbreviationum, so-lo più veloci. Essi affiancano la perizia del filologo, non la sostituiscono. Solo chi abdica a un qualunque uso dell’intelletto può pensare che una macchina prenderà il suo posto. Torniamo all’uso critico del pen-siero e al monito dell’Ulisse di Dante: non vivere come bruti riducendo l’attività umana allo svolgimento di funzioni meccaniche.
Nicolò Ghigi
Filologo bizantinista
Già collaboratore presso il Centro per le Digital Humanities di Venezia
(1) Tra gli strumenti più moderni e di felice realizzazione citiamo per il latino il database completo e molto versatile di poesia Musisque Deoque, mentre per la prosa ci si deve affidare a strumenti parziali co-me i motori di ricerca offerti dalla casa editrice Brepols; in modo pressoché completo per il greco è di-sponibile il Thesaurus linguæ grecæ (TLG) sviluppato dall’Università della California e ambiziosamente in-titolato come la monumentale raccolta collettanea principiata da Enrico Stefano nel XVI secolo.
(2) Oggi si scrivono interi articoli con un catenaccio di ricorrenze di medesime espressioni, cosa che un tempo si sarebbe trovata in nota. Le riviste scientifiche – specialmente quelle di studi letterari, duole ammettere – tendono a pubblicare i materiali che vengono loro inviati senza troppi scrupoli e non esita-no a lasciare spazio a questo genere di contributi, per i quali viene da domandarsi se davvero soddisfino quei criterî di originalità definiti irrinunciabili in un saggio scientifico. Articoli simili sono la testimo-nianza di come l’uso sragionato dell’IA produca veri e propri mostri, come fonti oggettivamente implau-sibili o irrisolvibili cruces che potrebbero essere sanate con uno sguardo all’edizione di riferimento.
(3) Si è ipotizzato l’utilizzo di intelligenze artificiali per la collazione di testi e realizzazione di apparati. In questo caso, il lavoro di addestrare la macchina a valutare le varianti è assai superiore a quello neces-sario per realizzare a mano l’edizione completa del medesimo testo. Secondo Lachmann, padre del me-todo filologico moderno, si tratterebbe di una procedura in linea con i criterî meccanici oggettivi. Seba-stiano Timpanaro criticò aspramente questa visione in un breve e godibile saggio che qualunque umani-sta dovrebbe leggere. Mi risulta però che oggi nessun filologo vorrebbe essere ridotto a mestierante dell’addestramento automatico dell’IA.
Trackbacks and pingbacks
No trackback or pingback available for this article.
Per qualsiasi domanda, compila il form
[contact_form name="contact-form"]Ultime notizie
03Oct
Leave a reply