Bit-Umbria » Bibliotheca Umbra

2. Digitalizzazione e codifica

La conversione dei testi in formato digitale, nella fase di avvio del progetto, è attuata interamente da Luigi M. Reale; in futuro, qualora il progetto - come è auspicabile e auspicato - possa avvalersi di contributi/finanziamenti esterni, la digitalizzazione sarà affidata ad un redattore qualificato (o a redattori qualificati, a seconda delle disponibilità finanziarie), sotto la supervisione del curatore.

La codifica prescelta per la conversione dei testi in formato elettronico è la XML-eXtensible Markup Language, derivata dal protocollo SGML-Standard Generalized Markup Language, che ha la prerogativa di favorire la portabilità dei dati tra diverse piattaforme di sistemi operativi.

In particolare, si è adottato lo schema di codifica stabilito dalla Text Encoding Initiative (TEI: http ://www.tei-c.org), nella versione pubblicata a giugno 2002 (nota come P4), già sperimentato in ambito umanistico per la costituzione di biblioteche digitali (un punto di riferimento specifico è il Progetto «TIL-Testi Italiani in Linea» del CRILET-Centro Ricerche Informatica e Letteratura, Università “La Sapienza” di Roma: http ://til.scu.uniroma1.it), schema che permette di mettere in adeguato rilievo le caratteristiche linguistiche dei testi.

il linguaggio XML piuttosto che per HTML è dovuta al fatto che, mentre gli elementi di HTML servono soprattutto alla descrizione della struttura fisica del documento ai fini della rappresentazione visiva su schermo, XML offre molto più efficacemente la possibilità di descrivere e di definire anche la struttura del contenuto dei documenti (ossia la descrizione logica delle informazioni testuali, a prescindere dalle modalità di visualizzazione a schermo). Si tratta perciò di ‘codifica semantica’, in quanto fornisce informazioni che non si limitano a rappresentare il testo ma lo descrivono compiutamente nella sua struttura. Questa opportunità è molto vantaggiosa per i testi letterari, permettendo l’individuazione di categorie semantiche pertinenti (ad esempio, il genere testuale, l’aspetto retorico-stilistico, fenomeni grafici e grammaticali, ecc.).

I file codificati in XML si avvalgono di XSL-Extensible Stylesheet Language, un foglio di stile che permette ai browser di interpretare i dati contenuti nel file d’origine. Le definizioni relative alla struttura logica del documento vengono fissate nelle DTD-Document Type Definitions, che stabiliscono tutti gli elementi strutturali del documento, le loro qualità e le relazioni fra gli elementi stessi (con marcatori più precisi e flessibili di quelli dell’HTML, che viceversa me prevede un numero chiuso e non incrementabile).

L’adozione dello standard XML ha dunque lo scopo di collocare la Bibliotheca al livello dei più qualificati progetti di digitalizzazione del patrimonio testuale.

3. Metadati catalografici

La Bibliotheca prevede l’integrazione con gli OPAC delle biblioteche istituzionali, perciò l’intestazione di ogni pagina è descritta anche secondo uno standard che ne facilita la catalogazione da parte dei bibliotecari.

Il catalogo della Bibliotheca è dunque realizzato nel rispetto del profilo catalografico Easycat.ER, per la descrizione delle risorse elettroniche, conforme agli standard del consorzio Dublin Core (http ://purl.oclc.org/dc/).

4. Sistema di interrogazione dei testi

La Bibliotheca non è soltanto un corpus testuale, una raccolta o collezione di testi, ma una biblioteca digitale, caratterizzata dalla possibilità di essere interrogata per cercare al suo interno le informazioni che si desiderano.

Tuttavia, il primum del progetto, fintanto che si regge sulle sole forze di chi lo ha concepito, è la digitalizzazione dei testi e la raccolta del materiale iconografico. Pertanto, il sistema di interrogazione testuale sarà elaborato in fase successiva.

5. Condizioni di utilizzo del servizio

L’utilizzo della Bibliotheca è gratuito ma subordinato a registrazione individuale: gli utenti interessati devono comunicare i propri dati, quindi riceveranno una password di accesso all’area riservata del sito che contiene i testi (ancora non attiva).

I testi consultati ed eventualmente acquisiti nel proprio PC potranno essere utilizzati esclusivamente per scopi di studio o per usi didattici senza fini di lucro. È perciò vietato servirsi dei testi a scopi editoriali e/o commerciali. Qualora si utilizzino brani desunti dai testi inediti della Bibliotheca è obbligo citarne esattamente la fonte (in maniera conforme a quanto si troverà indicato nel colophon di ciascun testo).

Luigi M. Reale, Perugia - Clusone (Bergamo), 10 settembre 2003


Questo articolo si può citare nel seguente modo:
Luigi M. Reale, Bit-Umbria » Bibliotheca Umbra, in «Italianistica Online», 10 Settembre 2003, http://www.italianisticaonline.it/2003/bit-umbria/

Questo articolo