Go to Arachnion nr. 1 - contents or to Arachnion - home page


Strumenti informatici per le lingue classiche [*]

di Maurizio Lana (Torino)


Sommario


1. I testi scritti in greco e latino

1.1. Particolarità proprie delle lingue classiche

I testi greci e latini non richiedono attenzioni o strumenti particolari se non nella misura in cui utilizzano (i testi greci e i testi latini che citano testi in greco) caratteri particolari. Infatti non tutti i programmi di text retrieval gestiscono tali caratteri. Si deve perciò ricorrere a transcodifiche dei testi (la codifica del greco in caratteri ASCII adottata dal TLG ne è un esempio) o all'uso di programmi che espressamente prevedano l'uso di caratteri e fonts specifici. Inoltre esistono per il greco e il latino due cd-rom che raccolgono i testi scritti in tali lingue, e ciò ha portato alla realizzazione di programmi specificamente destinati all'interrogazione di tali cd-rom.

I caratteri greci

Si chiamano fonts (in italiano «famiglie» o «fonti» di caratteri) i caratteri quando li si raggruppi per forma: si parla perciò (in senso proprio) di Times Roman o di Courier, ma anche (più genericamente) di font di greco o di ebraico.

Il problema dei fonts[1] necessari per scrivere correttamente il greco è solo una parte del più ampio problema del reperimento dei fonts appropriati al testo che si vuole scrivere/stampare oppure visualizzare.

Senza scendere in particolari molto tecnici, basti ricordare che esistono essenzialmente due tipi di fonts: i fonts bitmapped e i fonts vettoriali (o scalabili). Nei fonts bitmapped (anche detti semplicemente bitmap) il disegno dei caratteri è costituito da una serie di punti (bitmap significa in effetti «mappa di punti»), mentre i fonts vettoriali contengono per ogni segno le funzioni matematiche necessarie a tracciare le linee che lo compongono. In un font bitmapped una «o» sarà costituita da un numero di punti variabile in relazione alle dimensioni del carattere e alla risoluzione adottata, e ogni dimensione del carattere richiede un disegno apposito; in un font vettoriale il disegno di una «o» sarà costituito - un po' semplificando - da una funzione che traccia una circonferenza, di raggio variabile in relazione alle dimensioni del carattere.

Di particolare interesse sono i fonts scalabili del tipo Adobe e del tipo Truetype, entrambi disponibili per computer Dos e computer Macintosh. I secondi, in particolare, sono parte integrante sia del sistema operativo del Macintosh, sia di Windows, e possono essere trasferiti da un sistema all'altro grazie ad un apposito programma di conversione [2].

I principali fornitori di fonts TrueType hanno a catalogo moltissimi fonts: per il greco, l'arabo, il russo, l'ebraico, il cinese, praticamente per tutte le lingue del mondo. Essi sono:

Linguist's Software, P.O. Box 580, Edmonds, WA 98020-0580, USA, fax: 001-206-7715911;

Ecological Linguistics, P.O. Box 15156, Washington, DC 20003, USA.

I fonts di Linguist's Software sono molto utili perché adottano una codifica ASCII che è la medesima del TLG (l'omega è mappato sul «w», lo csi sulla «c»).

Si deve anche ricordare che alcuni fonts greci per Macintosh molto diffusi non sono in formato TrueType: è il caso di GreekKeys (Scholar Press, P.O. Box 15399, Atlanta, Georgia 30333-0399), indispensabile se si vuole lavorare interattivamente con Perseus, per esempio nella ricerca di parole in greco; o di Kadmos (Allotype Typographics, 1600 Packard Road, Suite 5, Ann Arbor, MI 48104).

Per il greco esiste anche un piccolo package autonomo, contenente un font greco TrueType, che si chiama WinGreek [3], disponibile su Internet.

L'alfabeto fonetico internazionale (IPA) è disponibile in formato TrueType, in tre stili (uno a spaziatura fissa, uno simile a Times, uno simile a Helvetica) realizzato da Summer Institute of Linguistic ed è anche disponibile in versione un po' meno ampia su Internet [4].

Le basi di dati

TLG

Tra le basi di dati testuali accessibili su cd-rom si deve certo ricordare per prima quella del TLG [5], che contiene tutti i testi greci da Omero al 1200 d.C. in machine readable form. Dal punto di vista del più stretto rigore filologico, si possono trovare varie imprecisioni [6], ma non si può che restare ammirati di fronte al lavoro che ha portato a questa raccolta dei testi degli scrittori greci dalle origini all'impero bizantino.

Poiché l'aspetto della vera e propria raccolta dei testi è praticamente completato, il TLG Project sta valutando in quale direzione proseguire il lavoro, e raccoglie consensi tra le altre la proposta di distribuire i testi accompagnati dalla loro analisi morfologica. resta da vedere come si risolverà il problema delle analisi morfologiche di passi oscuri per il lessico o per il significato, ma certo si tratta di una prospettiva di grande interesse.

La codifica adottata del TLG per rappresentare il greco classico utilizzando solo i primi 128 caratteri ASCII è a uno standard de facto. Qui sotto la tabella che contiene le corrispondenze tra caratteri greci e caratteri ASCII.


Here a table showing correspondences between ASCII Beta coding sequences and greek characters

Accenti e spiriti sono rappresentati da segni convenzionali, qui sotto esemplificati in associazione a vocali per meglio evidenziarli; i segni filologici tradizionali sono anch'essi opportunamente codificati (ne vengono qui esemplificati solo alcuni):


Here a table showing correspondences between ASCII Beta coding sequences and diacritical marks

La codifica del greco qui descritta ha poi una sua specificità che costituisce - in sostanza - un difetto: le parole inizianti con lettera maiuscola sono identificate da un * come primo segno della parola, e i segni che rappresentano spiriti e accenti della lettera maiuscola sono collocati davanti ad essa (per es.: *)ALE/XW) mentre nel caso delle parole inizianti per lettera minuscola i segni che rappresentano spiriti e accenti vengono collocati dopo la lettera a cui si riferiscono (per es.: A)LE/XW), cosa che rende impossibile la costruzione di un corretto elenco di forme in ordine alfabetico (a meno di voler distinguere le forme che iniziano per maiuscola da quelle che iniziano per minuscola). L'elenco alfabetico, come si vede qui sotto, non può in alcun modo essere costruito correttamente:

*)ALE/XW
  A)LE/XW
...
*)ALE/XW
A)LE/XW
...

Lo stesso problema si presenta se si vuole non un semplice elenco delle parole presenti in un testo, ma il conteggio delle parole (*)ALE/XW e A)LE/XW risultano essere due parole a tutti gli effetti differenti e le loro occorrenze non possono essere fatte confluire automaticamente in un unico totale). L'unica soluzione disponibile allo studioso sta nell'operare un complesso rimaneggiamento della codifica dei caratteri [7] trasportando, per tutte le parole inizianti per maiuscola, dietro alla lettera iniziale i segni diacritici che la precedono, e al fondo della parola stessa l'asterisco che la identifica come iniziante per maiuscola[8]. Si tratta di un difetto nella definizione della codifica derivante dalla scelta di trasportare in machine readable form la forma che il testo ha su carta (infatti nel greco a stampa gli spiriti e gli accenti precedono la lettera maiuscola a cui si riferiscono).

PHI

Per il latino esiste una base di dati simile a quella del TLG: è quella nota con il nome di PHI cd-rom[9]: esso contiene attualmente i testi latini dall'età arcaica all'età di Augusto; giungerà a contenere tutto il latino classico. Non presenta particolari problemi di codifica della lingua. Per il greco e per i segni filologici valgono le stesse convenzioni del TLG. La struttura dei testi è descritta in accordo con il Beta coding del TLG [10].

Duke Documentary Papyri

L'omonima raccolta di papiri [11] è pubblicata su cd-rom a cura del PHI.

Aureae Latinitatis Bibliotheca

Parlando di cd-rom contenenti testi classici non si può dimenticare la Aureae Latinitatis Bibliotheca distribuita dall'editore Zanichelli [12]. Essa si caratterizza per il fatto che la qualità dei testi proposti è più omogenea e migliore rispetto alle raccolte del TLG e del PHI.

Presenta un gravissimo limite per chi ne voglia fare un uso intenso e approfondito per la ricerca: i testi che contiene sono crittografati e possono essere esaminati soltanto con il programma di text retrieval incluso nel cd-rom. I cd-rom del TLG e del PHI si possono invece interrogare con una varietà di programmi poiché contengono i testi in forma non crittografata: ciò dà la più ampia possibilità di scelta dello strumento migliore per lo studio che si intende effettuare.

Il programma di text retrieval della ALB inoltre non prevede e non permette la stampa su carta degli esiti delle ricerche effettuate, cosicché occorre lavorare con carta e penna per trascrivere pazientemente gli estremi dei passi reperiti.

TLL

Il ThLL (Thesaurus Linguae Latinae, grandioso progetto di lessicografia latina con sede centrale Monaco di Baviera, ormai giunto a tre quarti del suo cammino), sarà reso disponibile su cd-rom con la sigla TLL, ad opera di un gruppo di lavoro internazionale diretto da Th. Brunner (già iniziatore e direttore del TLG Project). Attualmente (all'inizio del 1994) il TLL non è ancora entrato in fase operativa, perché il comitato scientifico sta definendo e risolvendo una serie di problemi teorici e metodologici preliminari.

Sembra opportuno farne qui menzione, anche se non esiste ancora neppure in forma iniziale, perché si tratta di un progetto di grandissimo rilievo come qualsiasi latinista facilmente comprende. Tanto più importante in quanto il testo del ThLL sarà consultabile - è facile prevederlo - tramite programma di interrogazione che permetterà di operare ricerche combinando come criteri i lemmi, il testo dei passi citati, i titoli delle opere citate, le epoche d'uso dei lemmi, e così via: cioè tutti gli elementi esplicitamente o implicitamente contenuti nelle voci del Thesaurus.

Patrologia Latina Database

L'editore inglese Chadwick-Healey pubblica la Patrologia Latina del Migne [13] registrata su cd-rom in maniera conforme allo standard TEI, completa del commento ai testi. Questa edizione si caratterizza per il fatto che il testo latino è codificato distinguendo le varie parti del testo (testo vero e proprio, citazioni nel testo, commento, citazioni nel commento) in modo tale da permettere di definire in relazione ad esse la ricerca delle parole. La codifica risponde allo standard TEI [14], che si va definendo, tra l'altro, allo scopo di permettere ricerche sui testi che tengano conto della struttura dei testi stessi: titoli, introduzioni, appendici, citazioni, note di commento, glosse marginali, apparato critico.

CLCLT (Cetedoc Library of Christian Latin Texts)

Il CETEDOC [15], congiuntamente con l'editore Brepols, pubblica un cd-rom di testi latini cristiani, il CLCLT (Cetedoc Library of Christian Latin Texts) [16]. Esso contiene i testi del Corpus Christianorum, series latina, più i testi di altri autori cristiani famosi e non contenuti nel Corpus Christianorum.

Thomae Aquinatis opera omnia

Contiene i 118 libri dell'opera di Tommaso d'Aquino, insieme ad altre 61 opere dello stesso periodo interessanti come elementi di confronto. L'opera è frutto di lunghi anni di lavoro e di studio di Roberto Busa S.J., iniziatore degli studi di analisi dei testi con l'ausilio del computer [16bis].

Libellus

Libellus è un archivio di testi latini in fase di ampliamento. Contiene attualmente testi di Virgilio, Lucrezio, Cicerone, Ausonio, Prudenzio, e altri. Lo si raggiunge tramite Internet: direttamente via FTP oppure da vari gopher[17].

Altre basi di dati

Alcune raccolte di testi, di solito non disponibili su cd-rom anche perché più piccole e orientate a temi molto più specifici [18]: i manoscritti del codice di Giustiniano[19], le iscrizioni in lingua greca dell'Asia Minore [20], le antiche iscrizioni greche [21] attiche, i testi in antiche lingue indoeuropee [22], i testi sulla musica scritti in latino [23], il corpus dei Grammatici Latini del Keil [24].

Si può accedere a testi classici greci e latini (ma non solo a quelli) anche facendone richiesta ad alcuni archivi esistenti nel mondo. Si possono qui citare l'OTA , il TLG stesso e l'Istituto di Linguistica Computazionale del CNUCE[25].

In un ambito connesso a quello della civiltà greco-latina non si devono dimenticare analoghe iniziative volte a raccogliere versioni e codici del testo biblico [26] o del corpus neotestamentario.

1.2. Programmi per lemmatizzare il greco e il latino

LemLat/SIL

Lemlat (LEMmatizzazione del LATino) è un lemmatizzatore basato su una tecnica di analisi delle forme latine del tutto nuova, ideata da N. Marinone. Essa è stata affinata sul corpus dei Grammatici Latini e permette addirittura l'analisi corretta delle forme ipotetiche che si trovano in quei trattati.Il programma è stato realizzato presso l'Istituto di Linguistica Computazionale del CNUCE di Pisa da A. Bozzi e G. Cappelli.

Lemlat è consultabile tramite SIL (Sistema Informativo per il Latino), oppure tramite Kleio, programma finalizzato alla analisi e gestione delle fonti storiche [27].

Lo sviluppo a cui è giunto il sistema lemmatizzatore Lemlat è comunque alquanto più avanzato di quanto risulti attraverso SIL o in Kleio (che sono in difficoltà per esempio nell'analisi dei pronomi). Tali programmi infatti incorporano una versione di Lemlat ormai abbastanza datata .

PC-Morph

PC-Morph è un programma per la lemmatizzazione del greco, non disponibile correntemente in commercio, circolante nell'ambito della ricerca universitaria [28], ed è la rielaborazione per personal computer Dos del programma Morph scritto da D. Packard per grandi computer. Esso opera la lemmatizzazione in modo semiautomatico (attende modifiche o conferma da parte dell'utente per ogni lemma individuato) a partire da un dizionario che viene accresciuto man mano che l'utente definisce nuove analisi per forme prima non presenti in esso. Il programma scrive come output due file: uno contiene sequenzialmente le analisi delle forme, l'altro contiene sequenzialmente i lemmi. Ciò rende possibile operare analisi di testi e metatesti così come sono state prospettate a pag. 111. Occorre peraltro precisare che il programma presenta un'interfaccia utente piuttosto spartana, ma è di grande valore il fatto che il codice sorgente, che contiene tutti gli algoritmi di analisi del greco, possa essere fornito a chi ne faccia richiesta impegnandosi a non utilizzarlo a fini di lucro e a indicarne gli autori qualora ne facesse uso o menzione pubblica.

Morpheus

Morpheus è un programma di lemmatizzazione per il greco, anch'esso come PC-Morph derivato da Morph di D. Packard, che è disponibile solo in Perseus. Di Perseus si parla altrove (cfr. pag. 188); qui interessa mostrare in forma essenziale il procedimento di lavoro con Morpheus, anche perché si tratta di un prodotto di altissimo livello per la capacità di gestire testi in tutti i dialetti greci. Non a caso l'esempio qui riportato parte dall'analisi di una forma verbale in Pindaro, caratteristica del dialetto dorico.

Si può avviare l'analisi morfologica anche ex abrupto, come funzione a sé, ma il suo uso più ovvio è quello che si colloca nel corso della lettura di un testo.

Come si vede alla figura 1, la forma di cui si vuole l'analisi morfologica viene evidenziata nel testo


Here an image showing the first stage of a morphological analysis  of a word in Pyndar text Figura 1: testo di Pindaro contenente la forma da analizzare

(con il mouse, nella maniera consueta su Macintosh); successivamente si clicca su Analyze.

Cliccando su Analyze si avvia l'analisi morfologica: essa elenca tutti i possibili lemmi e descrizioni morfologiche che risultino validi per la forma in esame. Ciò può anche essere sufficiente, ma la lista dei lemmi (tre, nel caso descritto dalla figura 2)


Here an image showing the possible analyses for the word highlighted in fig. 1Figura 2: le varie analisi possibili per la forma evidenziata nella figura 1

può essere utilizzata per selezionare un lemma (lo si evidenzia nella maniera consueta) ed esploderlo ricercandone tutte le forme presenti in un dato autore (in assenza di altre indicazioni, l'autore del testo da cui l'analisi morfologica è stata avviata).

La figura 3 mostra l'esplosione del lemma e l'elenco delle sue forme presenti in Pindaro.


Here an image showing the 'explosion' of the lemma highlighted in fig. 2,  into all his forms found in Pyndar Figura 3: le occorrenze in Pindaro del lemma di figura 2

Selezionando una qualsiasi di tali forme e cliccando su Go To Text si viene portati nel testo nel punto si trova la forma selezionata (si noti l'errore della prima forma dell'elenco, scritta con accento acuto - ei/rh/setai - in luogo dello spirito dolce - ei)rh/setai).

L'utilità per la didattica (soprattutto la fase 2), ma anche per la ricerca (soprattutto la fase 3) sono evidenti; basta riflettere a quanto tempo richiederebbe, con strumenti cartacei, una ricerca come quella della fase 3. E si noti che i campi Look for..., in..., Type of Search..., Sort By... sono tutti modificabili: si può per esempio cercare in altri autori il lemma, o una delle forme, individuati in Pindaro.

1.3. Concordanze dinamiche

LBase

LBase [29], programma per Dos, permette di effettuare ricerche sui cd- rom del TLG e del PHI con operatori logici, wildcards e segni diacritici opzionali [30], utilizzando le categorie di genere e di epoca definite per gli autori del TLG. Può esportare dati in formato WordPerfect, Nota Bene, ChiWriter, Multilingual Scholar.

Essendo un programma per Dos e non per Windows presenta alcuni pregi e limiti ovvi: può funzionare con prestazioni accettabili anche su computer di fascia medio-bassa (mentre Windows 3.1 richiede una certa potenza di elaborazione), ma la gestione dei caratteri greci non è ottimale (la stampa di passi di testi in greco è piuttosto lenta e non bella). L'autore del programma, a quanto sembra di capire, sta concentrando la sua attività sui due programmi elencati qui di seguito, entrambi per Windows.

TLGWorkplace

TLGWorkplace [31] è un programma Windows specificamente orientato alla gestione del cd-rom del TLG. Offre le consuete funzioni di ricerca di forme e di combinazioni di forme tramite operatori logici e di prossimità, wildcards, segni diacritici opzionali, classificazioni per generi ed epoche.. Si caratterizza per la possibilità effettuare ricerche sull'indice delle forme presenti nel TLG (si tratta di un elenco contenente tutte le forme del TLG, molto utile per evitare di fare ricerche inutili o poco significative in quanto permette di verificare se una data forma esiste o no, e con quante occorrenze), e per la possibilità di esportare dati verso Word per Windows, WordPerfect e Nota Bene. Include fonts greci TrueType e Adobe Type1.

PHI Workplace

Per PHI Workplace valgono le stesse considerazioni fatte a proposito di TLGWorkplace.

Musaios

Musaios [32] è un programma per Windows (evoluzione di un programma per Dos chiamato Searcher, poi diventato - in versione Windows - Pharos, quindi Scriptorium) che essenzialmente gestisce interrogazioni sui testi raccolti nei cd-rom del TLG e del PHI.

Esso presenta alcuni aspetti interessanti:

- è possibile operare ricerche sull'indice delle forme presente nel cd-rom del TLG [33];

- è possibile aprire più testi contemporaneamente;

- le ricerche su cd-rom possono essere eseguite in background, mentre si lavora con un altro programma;

- è in progetto una versione per Macintosh.

Pandora

Pandora [34] è un programma per Macintosh (Hypercard) realizzato nell'ambito del progetto Perseus, ed espressamente destinato alla gestione di ricerche sul cd-rom del TLG; con qualche adattamento, descritto dal distributore stesso del programma, è possibile utilizzarlo anche per ricerche sui testi contenuti nel cd-rom del PHI.


Here an image showing the main screen of PandoraFigura 4: la schermata principale di Pandora.

Il programma gestisce - con un'interfaccia molto amichevole - ricerche con operatori logici (reperire la forma A «e» la forma B; reperire la forma A «e» la forma B «e» la forma C) e operatori di prossimità (reperire la forma A «e» la forma B alla distanza massima di X righe; reperire la forma A «e non» la forma B alla distanza massima di 2 righe) e permette di esportare (in formato di interscambio RTF) gli estremi dei passi eventualmente accompagnati dai passi stessi. La figura 4 mostra la schermata centrale del lavoro con Pandora: quella dove, tra l'altro,

si impostano i caratteri greci da utilizzare per scrivere le forme da ricercare e per l'esportazione dei risultati (Setup),

si definisce la ricerca da effettuare,

si imposta una eventuale ricerca sull'indice delle forme del TLG (Index Search),

se ne vede l'esito (Results),

si selezionano i passi da leggere direttamente,

si sceglie se esportare le citazioni o anche i passi (Export).

SNS Greek & Latin

SNS Greek & Latin è un programma per Macintosh con interfaccia utente in italiano (l'unico tra tutti quelli descritti in questo volume) per effettuare ricerche sui cd-rom del PHI e del TLG [35]. Non ha particolari esigenze di memoria, permette di definire le ricerche in formato GREP, esporta i dati verso Word e anche verso programmi di archivio come 4th Dimension e FileMaker.Offre le consuete funzioni di ricerca con un costo piuttosto alto in confronto a Pandora.

TLG Engine

TLG Engine [36], programma per Macintosh, permette scorrere il testo di un autore e opera a scelta, e di esportare il testo selezionato verso qualsiasi programma di scrittura convertendolo dal Beta coding in formato utilizzabile dal font greco accluso.

Lexis

Lexis [37] è un programma per ricerche lemmatizzate di testi greci e latini. Per qualsiasi testo del TLG Lexis produce un lessico lemmatizzato con citazioni, statistiche e rinvii a parole collegate.

1.4. Il progetto Perseus

Perseus 1.0 [38] è un sistema costituito di testi su cd-rom e di immagini su videodisco realizzato ad Harvard: Interactive Sources and Studies on Ancient Greece. Il progetto è diretto da G. Crane. Esso funziona su computer Macintosh [39] e consiste in un archivio di svariati tipi di materiali concernenti la Grecia classica:

- le opere complete di Omero, Eschilo, Sofocle, Erodoto, Tucidide, varie opere di Esiodo, Pindaro, Pausania, il manuale di mitologia attribuito ad Apollodoro, Plutarco (molti testi provengono dal TLG: cfr. pag. 177), con traduzione a fronte;

- 2400 immagini di vasi a figure rosse;

- 2300 immagini e 150 mappe relative a 800 diversi siti archeologici accompagnate dalle corrispondenti immagini a colori riprese dal satellite Landsat;

- 1060 immagini di monete; descrizioni e piante di 310 costruzioni;

- il Liddell-Scott Intermediate Greek-English Lexicon;

- un sommario storico delle principali vicende del V secolo;

- un atlante con carte generali e regionali;

- una enciclopedia di antichità classiche.

Fin qui, ciò che appare. Ma Perseus contiene anche un programma per ricerca di parole nei testi greci (la versione commerciale autonoma è Pandora: cfr. pag. 186), e un analizzatore morfologico (Morpheus) capace di analisi lemmatizzate quali la ricerca automatica delle varianti dialettali dei lemmi (es. le forme doriche o eoliche di un lemma richiesto nella sua forma standard, cioè quella attica; cfr. pag. 183).

Lo scopo è quello di permettere, grazie alla miriade di collegamenti interni tra tutte le varie parti del sistema, una 'lettura' globale della civiltà greca del V secolo: «Tutti i materiali contenuti in Perseus sono strettamente collegati, cosicché il lettore di un'opera teatrale se incontra il nome di Eracle può facilmente trovare occorrenze dello stesso nome in altri testi, vedere raffigurazioni del personaggio o una carta geografica su cui sono indicati i luoghi importanti per quel personaggio, consultare un dizionario, legggere la voce Eracle sull'enciclopedia.» (E. Mylonas, Managing Director del Progetto Perseus).

È così possibile 'navigare' attraverso questa massa di materiali assumendo come criterio di partenza la lettura del sommario storico (per es.: si parte dall'evento storico della battaglia di Maratona; da esso si può passare a leggere i testi che ad essa fanno riferimento, vedere raffigurazioni di battaglie, studiare una carta che evidenzia i nomi dei luoghi importanti per la guerra; oppure si può leggere Erodoto sulle guerre persiane, vedere le fotografie aeree dei luoghi citati, passare al sommario storico, passare a leggere un passo di Eschilo, osservare un vaso che raffigura una rappresentazione teatrale, scrivere annotazioni di proprio pugno da lasciare collegate a un certo passo di Eschilo o all'immagine di una moneta.

Fin qui quanto viene fornito dal gruppo di lavoro del Progetto.

Ma - è questo l'aspetto più interessante - è anche possibile al lettore 'creare' nuovi percorsi di navigazione attraverso i materiali di Perseus. Tali percorsi possono essere registrati permanentemente e permettono quindi di fissare lo sviluppo di una ipotesi di interpretazione di un testo (il punto di avvio può essere dato da un testo che per qualche ragione risulti oscuro, e il percorso di lettura può allora essere costituito dai testi, dai dati fattuali, dalle immagini che eventualmente abbiano permesso di giungere a fare luce sul problema), oppure di preparare lezioni per gli studenti. Non solo: è anche possibile aggiungere nuovi materiali (annotazioni personali, testi, immagini). In tal modo il sistema non si limita a rispecchiare le prospettive interpretative della civiltà greca classica proprie del gruppo di lavoro che ha prodotto Perseus, ma può essere messo a punto da ogni singolo studioso e tale arricchimento interpretativo può essere condiviso con altri.

Certo si può, da 'buoni europei', e da filologi giustamente pignoli e attenti, discutere sul fatto che i testi greci provengono dalla Loeb Classical Library, che l'enciclopedia di antichità è della fine del secolo scorso (onde evitare problemi di copyright), e via di questo passo; ma il sistema, grandioso e affascinante nel suo complesso, è certamente un segno di vitalità autentica degli studi classici e del loro confronto con le tecnologie più avanzate.


[*] Queste pagine riprendono il capitolo 8 del volume dell'Autore: «L'uso del computer nell'analisi dei testi», FrancoAngeli, Milano, 1994. I riferimenti interni di pagina che il lettore può incontrare non sono stati modificati.

[1] Di solito non si fa distinzione, nel caso dei fonts per lingue straniere, tra le varie forme (più arcaizzanti o più moderne) che essi possono avere (basti confrontare questi due diversi tipi di caratteri greci: Here an image showing two diifferent styles for greek characters.

[2] Il programma TTConverter (per Macintosh) è disponibile sul gopher del CISI dell'Università di Torino, cfr. pag. 234. Il fatto che sia un programma Macintosh non impedisce di usarlo per convertire font TrueType per Windows nel formato del Macintosh, in quanto tutti i computer Macintosh possono (con apposito programma della Apple chiamato Apple PC Exchange) leggere dati da dischetti formattati in standard MS-Dos a 720 kbyte o a 1,44 megabyte.

[3] Anch'esso è reperibile su Internet tramite ricerca con server archie e gopher, oppure direttamente con ricerca nel gopherspace: si veda pag. 219ss.

[4] Font Development, SIL Printing Arts Dept., 7500 West Camp Wisdom Rd., Dallas, TX 75236, USA; e-mail: victor.gaultney@huntpo.sil.org. Per il reperimento su Internet basta una generica ricerca con archie e FTP (cfr. pag. 220ss.), oppure con gopher (cfr. pag. 223ss.).

[5] Thesaurus Linguae Graecae Project, University of California, Irvine, CA 92717 (e-mail: tlg@uci.edu). La licenza d'uso per i privati costa 500 dollari per cinque anni.

[6] Si pensi per esempio che non sempre i diversi libri dell'opera di un autore sono presenti nel testo di un'unica edizione critica; o che le edizioni critiche non sempre sono le più convincenti o recenti. È evidente però che tale raccolta di testi ha il suo valore primario nell'ampiezza, costituendo una base di dati molto ampia su cui effettuare ricerche lessicali a supporto e approfondimento dello studio di una specifica opera o argomento. Il TLG, o più in generale le raccolte di testi su cd-rom, non potranno mai sostituire le edizioni critiche su carta.

[7] È qui che giungono in soccorso i programmi di «filtro» ricordati a pag. 142.

[8] L'asterisco, in tale posizione, non interferisce con l'ordinamento alfabetico e conserva però la sua funzione di identificatore di parola iniziante per maiuscola.

[9] Packard Humanities Institute, 300 Second Street, Los Altos, CA 94022. La licenza d'uso per tre anni costa 100 dollari (dati validi all'inizio del 1994).

[10] Cfr. pag. 68s.

[11] Duke Data Bank of Documentary Papyri, William H. Willis, John Oates, Co-directors, Duke University, Room 201B, Perkins Library, PO Box 4762, Duke station, Durham, NC 27706.

[12] Zanichelli Editore S.p.A., Via Irnerio 34, 40126 Bologna; costo 900.000 lire circa. Sotto il profilo scientifico è stata curata da P. Mastandrea, dell'Università di Venezia. I testi raccolti provengono in gran parte dalle edizioni Zanichelli. Il costo è di circa un milione.

[13] Patrologia Latina Database (per complessivi 4 cd-rom): Chadwick-Healey, Cambridge Place, Cambridge, CB2 1NR. Al prezzo di 30.000 sterline si ricevono tre copie dell'opera (dati validi a metà del 1993) A giugno 1995 il costo d'acquisto tramite per acquisto tramite Informazioni Editoriali, Via C. Poma 1, 20129 Milano; fax 02 - 70129424, risulta essere di 86.000.000 di lire.

[14] Text Encoding Initiative; cfr. pag. 60.

[15] Cetedoc, P. Tombeur, Batîment 16A, Université Catholique de Louvain, B-1348 Louvain-La-Neuve.

[16] È distribuita da Brepols Publishers, Baron Fr. du Fourstraat 8, B-2300 Tournhout. Il costo del primo Cdrom, con impegno all'acquisto dei successivi aggiornamenti, è di 8.800.000 lire (per acquisto tramite Informazioni Editoriali, Via C. Poma 1, 20129 Milano; fax 02 - 70129424).

[16bis] L'opera su Cdrom è ditribuita da Editel - Editoria Elettronica, Via Savona 112/a, 20144 Milano; tel. 02/48952533; fax 02/48954414; al prezzo di 1.300.000 lire.

[17] Per la connessione FTP l'indirizzo è ftp.u.washington.edu; i dati si trovano in /public/libellus/texts. Un gopher attraverso il quale si accede a Libellus è wiretap.spies.com; si selezionano, a partire dalla prima schermata, le voci Wiretap Online Library; Classics; Latin; Libellus.

[18] I dati relativi a questi progetti sono stati raccolti interrogando il Catalogue of Projects in Electronic Text, realizzato dal Center for Text & Technology della Georgetown University (Reiss Science Building, Room 238, 37th and 0 Street NW, Washington, DC 20057). Esso può essere raggiunto tramite Internet: cfr. in particolare pag. 226.

[19] Collection of the Manuscriptsof Justinian Code, Gero Dolezalek, Gerard-Noodt-Institut, Katholieke Universiteit, Thomas-van-Aquino-Straat 6, NL-6500 KK Nijmegen.

[20] IASEP, Donald F. McCabe, the Institute for Advanced Study, School of Historical Study, Princeton University, Princeton, NJ 08544.

[21] DBAGI, William C. West, Dept. of Classics, University of North Carolina at Chapel Hill, 212 Murphaey Hall (030A), Chapel Hill, NC 27514.

[22] Thesaurus of Texts in Ancient Indo-European Languages, Jost Gippert, Freie Univeristät Berlin, Fachbereich Altertumswissenschaften, Institut für Indogermanistik und Orientalistik (WE02), Seminar für Vergleichende und Indogermanische Sprachwissenschaft, Fabeckstrasse 7, 1000 Berlin 33 Germany.

[23] Thesaurus Musicarum Latinarum, Thomas J. Mathiesen, School of Music, Indiana University, Bloomington IN 47405; raccoglie testi latini dal sesto al sedicesimo secolo che trattano di musica.

[24] Edizione elettronica a cura di N. Marinone e V. Lomanto, prossimamente disponibile sul gopher del CISI dell'Università di Torino (cfr. pag. 234).

[25] ILC, via della Faggiola 32, 56126 Pisa.

[26] Si possono qui ricordare:

- CATAB, Batîment Themis C, Université J. Moulin Lyon III, 43 Bd. du 11 Novembre 1918, 69621 Villeurbanne, France: mira ad uno studio approfondito del testo masoretico (cioè il testo trasmesso dalla tradizione);

- Concordanza della Bibbia Siriaca, dell'Istituto della Peshitta, Leida; in collaborazione dal 1988 con uno studioso italiano, P. Borbone, mira a codificare il testo siriaco e a produrre concordanze che tengano conto di tutte le varianti contenute nei manoscritti che si vanno man mano raccogliendo;

- CATSS (Computer Assisted Tools for Septuagint Studies), diretto da R. Kraft e E. Tov; Dept. of Religious Studies, Box 36, college Hall, University of Pennsylvania, Philadelphia, PA 19014-6303;

- Centre "Informatique et Bible", diretto da R.F. Poswick, Maredsous, B-5198 Denée, che raccoglie manoscritti ebraici e greci dell'Antico Testamento.

[27] Per Lemlat e i suoi sviluppi più recenti, informazioni presso: N. Marinone, Dipartimento di Filologia, Linguistica, Tradizione Classica, Università di Torino, Via S. Ottavio 20, 10124 Torino.

Lemlat può essere usato tramite il programma SIL (Sistema Informativo per il Latino), per il quale ci si può rivolgere a A. Bozzi o G. Cappelli presso: Istituto di Linguistica Computazionale del CNUCE, via della Faggiola 32, 56126 Pisa.

Il lemmatizzatore è anche incorporato in Kleio, programma finalizzato alla analisi e gestione delle fonti storiche. Per Kleio informazioni presso M. Thaller, Max-Planck-Institut für Geschichte, Hermann Föge Weg 11, Postfach 2833, D-3400 Göttingen (e-mail: mthalle@gwdg.de); o, ancor meglio, presso Kleio Support Team, Humanities Computing Centre, Queen Mary & Westfield College, University of London, Mile End Road, London E14NS, UK (fax: 44-81-9808400; e-mail a Peter Denley, p.r.denley@qmw.ac.uk). Il sistema di lemmatizzazione sarà disponibile via FTP per giugno 1994 (comunicazione di P. Denley all'Autore).

[28] Occorre rivolgersi a G. C. Neal, professore di greco dell'Università di Manchester (e-mail g.c.neal@manchester.ac.uk oppure mffgkgn@cms.mcc.ac.uk; fax: 44-61-2753031).

[29] J. Baima, Silver Mountain Software, 7246 Cloverglen Drive, Dallas, TX 75249; e-mail: baima@onramp.net.

[30] Cioè: scrivendo per esempio i nomi propri senza indicarne lo spirito, se ne reperiscono anche le occorrenze che portino (di solito per crasi) lo spirito aspro in luogo di quello dolce.

[31] J. Baima, Silver Mountain Software, 7246 Cloverglen Drive, Dallas, TX 75249; baima@onramp.net.

[32] È realizzato da due ingegneri (R. Smith e D. Dumont) nel tempo libero. Per informazioni: Musaios, attn. D. J. Dumont, 15237 Sunset Boulevard, Suite 20, Pacific Palisades, CA 90272; e-mail: rsmith1@cerf.net oppure dumont@cerf.net; il costo è di circa 70 dollari.

[33] Il cd-rom del TLG contiene un elenco di tutte le forme presenti nel disco stesso. È evidente l'utilità: chi sia interessato a ritrovare i passi di scrittori greci che facciano menzione del nome «Tucidide» può innanzitutto (a differenza da ciò che accade in una normale ricerca di forme su un corpus di testi) sapere subito se la forma cercata esista; inoltre le ricerche effettuate utilizzando l'indice delle forme sono molto più rapide (per reperirle non occorre che il programma legga sequenzialmente i testi); il limite è dato dal fatto che non si possono combinare criteri di ricerca («tutti i testi che contengono "Tucidide" e "Peloponneso" a una distanza massima di 10 parole»).

[34] Intellimation, Dept. XA, PO Box 1922, Santa Barbara, CA 93116; fax: 001-805-9688899; oppure: Scholars Press c/o Professional Book Distributors, PO Box 6996, Alpharetta GA 30239-6996; fax: 001-404-4429742.

[35] Per informazioni e acquisto di SNS Greek & Latin rivolgersi a: Laboratorio Informatico per le Lingue Antiche, Scuola Normale Superiore, 56100 Pisa, Italy; fax: 0039-50-563513; e-mail alphamai@ipisnsva.bitnet.

[36] Linguist's Software, P.O. Box 580, Edmonds WA 98020-0580; fax:001-206-7715911.

[37] Autore è Richard Goulet, Director, Centre National de la Recherche Scientifique (Paris); per informazioni rivogersi a Arlette Chancrin, 172, avenue de Choisy, 75013 Paris, France; fax: 33-1-45826976 (o 44245200).

[38] Perseus Project, Department of the Classics, 319 Boylston Hall, Harvard University, Cambridge, MA 02138; e-mail: coleman@yalevm.bitnet. Nel 1994 ne sarà distribuita la versione 2.0. Per l'acquisto rivolgersi a: Yale University Press, 23 Pond Street, London NW3 2PN (o anche al distributore di Yale University Press: John Wiley & Sons, Ltd., Baffins Lane, Chichester, West Sussex PO19 1UD; fax: 0044-243-775878. Il costo si aggira per la versione 1.0 sui 350 dollari per la versione completa (cd-rom, videodisco, documentazione), e sui 150 dollari per la versione ridotta (solo cd-rom e documentazione: quindi niente immagini da Landsat e parti filmate, e minor numero di immagini di vasi, monete, siti.).Del progetto si è parlato anche nelle pagine iniziali (cfr. pag. 31). Vengono qui riprese le notizie essenziali.

[39] La conversione dell'intero sistema è un problema di fondi (la conversione di Perseus 1.o per Windows richiede circa 50.000 dollari) e di possibili acquirenti (quanti sono? e quindi quanta parte del costo di Perseus per Windows può essere scaricata su di loro?).


Go to Arachnion nr. 1 - contents or to Arachnion - home page


Last technical revision June, 9, 1995.

This document (http://www.cisi.unito.it/arachne/num1/lana.html) is part of «Arachnion - A Journal of Ancient Literature and History on the Web» (http://www.cisi.unito.it/arachne/arachne.html). The editors are Maurizio Lana and Emanuele Narducci. The journal is distributed by the host of CISI - Università degli Studi di Torino, Via Sant'Ottavio 20, I-10124 Torino .
Quoting this document, please remember to mention the original paper edition, if any, and the electronic edition of Arachnion (in the form: Arachnion. A Journal of Ancient Literature and History on the Web, nr. 1 - http://www.cisi.unito.it/arachne/num1/lana.html). If you like to access this document through a WWW page, please create a link to it, not to a local copy.