L’INDEX THOMISTICUS  Come nasce il progetto New York, 1956. Padre Busa

“ .. Quando preparavo la docenza all'Università Gregoriana di Roma, avevo per tema il concetto di "presenza" di San Tommaso. Dopo sei mesi di lavoro, ricercando manualmente la parola "presenza" nei testi, mi sono accorto che quella parola nel vocabolario di San Tommaso è periferica. La parola centrale, é la preposizione "in". Allora ho ricominciato da capo. Mi son schedato a mano più di diecimila passi, in cui c'era l'uso della preposizione "in". Ho giocato dei grandi solitari, con queste schede, ne è venuto fuori il libro della mia docenza, insieme con due idee. La prima: il valore pregnante filosofico delle particelle del discorso degli uomini, la preposizione "in" è una delle chiavi del pensiero filosofico, già dai tempi di Aristotele, non è iniziato con San Tommaso. Secondo: che io avrei reso un buon servizio alla comunità degli studi, se avessi trovato la maniera di risparmiarle il rifarsi a mano le schede di tutte le parole. Nel '49, ebbi l'occasione, di fare un primo viaggio negli Stati Uniti, dove ho visitato una quarantina di università, da costa a costa, cercando delle macchine per fare quello che io volevo, cioè ‘elaborare le concordanze linguistiche’ ( dei quasi 9  milioni di vocaboli di S. Tommaso fare l’elenco di tutte le frasi che contengono una determinata parola ). Mi rivolsi a un giovane professore al MIT ( Massachusetts Institute of Technology , che mi mandò alla IBM ( International Business Machines Corporation ). Così nel 1949 ho cominciato a trafficare con la macchina della IBM. Il lavoro è durato fino al 1980, con la stampa dei cinquantasei volumi. Credevo di aver finito e non avevo finito, perché ero interessato all'evoluzione. Ci sono state tre epoche: prima fase le schede perforate. L'obiettivo era uno schedario di dodici milioni di schede, quindi un fronte di novanta metri, alto 1,20, profondo un metro, peso 500 tonnellate. Io avevo perforato e consumato un sei milioni di schede, stampando dietro il contesto di ciascuna. La misericordia del Signore, ha ispirato i tecnici ad inventare i nastri magnetici. E così non più cinquecento tonnellate di materiale. Seconda fase: impiego dei nastri magnetici. Ho avuti un pacco di 1.800 nastri magnetici, che sono 1.600 chilometri di nastro, come da Parigi a Lisbona, o Milano-Palermo. Alla fine ho avuto un altro formato di venti nastri magnetici, sedici chilometri di nastro, con 1.630.000.000 di byte. Questi venti nastri magnetici hanno preso da loro due strade: dal 1974 hanno cominciato ad andare in stampa su carta ed hanno prodotto le settantamila pagine dell'"index tomisticus". Nel 1980 abbiamo cominciato a pensare a forme più abbreviate e nel '92 abbiamo messo tutto su CD ROM ( Opera Omnia edita dalla Editel di Milano ). Un CD ROM, di quelli ancora in uso, ha una capienza di seicento milioni di byte. Noi ne avevamo un miliardo e seicentomila, però han potuto essere compressi, senza perdere informazioni, in duecento megabyte, e adesso c'è questo dischetto in cui, su una spirale di quattro chilometri e mezzo, c'è tutto quello che mi stava in venti nastri magnetici. Questa è stata l'evoluzione. Ma io mi barcamenavo ormai abbastanza bene con i vecchi computer che chiamo i "dinosauri". Negli ultimi anni, a Venezia, erano una dozzina di armadi come pianoforti verticali, collegati da cavi sotto il pavimento. Oggi ci sono i personal computer, sapete meglio di me cosa fanno .. ”

 

( da un’intervista a Padre Busa nel 1995 presso l’Università di Roma ‘La sapienza’)

 

L’importanza dell’opera

 

L’Index è quindi un’imponente analisi linguistica delle opere di S.Tommaso d’Aquino che segna la nascita dell’informatica linguistica. Alla base dei suoi studi un'intuizione geniale, ripresa poi dagli scienziati di tutto il mondo come premessa per la linguistica computazionale: nell'informatica e nello studio delle lingue bisogna operare sull'ipertesto totale, quello che distingue il significato delle parole eliminando ad esempio gli omografi (stessa scrittura) e gli omofoni (la stessa pronuncia). Per questo Roberto Busa puo' essere considerato uno dei padri storici dell'ipertesto, il metodo che sta alla base dell'editoria elettronica. La sua opera infatti ci permette oggi di rintracciare in pochi istanti tutti i passi che contengono una qualsiasi parola contenuta nei 118 libri di San Tommaso ed in altri 61 di autori contemporanei. Questo sistema consente un'analisi linguistica del latino dell'epoca, dello stile dell'autore e permette la consultazione rapidissima delle occorrenze di ogni termine ( operazioni che, fatte a mano, richiederebbero mesi se non anni di lavoro ). Inoltre, distinguendo i termini omografi, indirizza la ricerca diminuendo la possibilità di errori . Ad esempio: cercando la parola facies (che puo' significare sia il sostantivo viso che il verbo fare) il sistema avverte che esistono due significati possibili e chiede all'utente su quale desidera compiere l'analisi (quello che, in sostanza, sarà il compito del futuro linguista computazionale).

Padre Busa non si è però limitato a radiografare frasi e vocaboli, a triturarli fino a ridurli in bit e byte, per poi manipolarli elettronicamente: i 22 milioni di parole in 21 lingue, basate su 10 alfabeti, sono state il punto di partenza di una continua riflessione, condensata nei 1261 ‘momenti di pensiero’ ( sulla scia di Wittgenstein ) raccolti nel volume “Dal computer agli angeli”, pubblicato nel 2000. L’autore illustra così la sua idea di ‘ontologia generativa’, riconoscendo nell’uomo la partecipazione alla capacità creativa propria di Dio Creatore: ogni attività umana, compresa l’informatica, avviene per la spinta delle forze interiori costitutive dello spirito umano, quello spirito immesso nel corpo di ogni persona appunto da Dio, che è per cui all’origine di ogni cosa ( non a caso Roberto Busa parla del computer come ‘nipotino di Dio’ ).