Salta al contenuto principale

Considerazioni di Di Grande sulla correzione di testi scannerizzati

inoltrate da Carlo Loiodice su mbx, 23\01\2010, h. 09.59.

Ecco la risposta pervenutami da Giuseppe. Più chiaro di
così! I collezionisti non lettori sono avvertiti. I lettori non
collezionisti, ossia quelli che chiedono oppure accolgono regali altrui,
sono invitati a una maggiore cautela.

Ed ora, un po' di pubblicità

:

Ogni volta che parlo di come correggere libri, sin dal 1999 quando li facevo
in ms-dos con SCT, il nonno di Biblos, ci tengo a far capire i tre livelli
di correzione affinché un libro per me possa dirsi corretto:
1. correzione automatica per eliminare dal libro appena scannerizzato gli
errori di riconoscimento del programma OCR. Nel 1999, quando utilizzavo
ancora Omni Page per Windows 3.1, questo aveva più senso; ora con Fine
Reader un po' meno, anche se ancora qualche m viene tradotta in rn, o Il in
ll o II.
2. Analisi ortografica che permette di individuare parole errate ed
eventualmente intervenire correggendole. Non si tratta più di semplici
automatismi come al punto 1, ma di una approfondita analisi, anche se fatta
da un computer, di tutto il documento. Se nel primo caso ce la cavavamo in
qualche secondo di lavoro, in questo il lavoro di analisi si allunga a
qualche ora (sempre in base alle pagine del libro e alla propria
disponibilità). Biblos, parlo naturalmente del mio caso, non analizza solo
lettere e numeri, così come faceva sct, ma analizza anche la punteggiatura.
Inoltre quando l'analisi si ferma su un termine in cui lo scanner ha fatto
un disastro e proprio ci risulta difficile correggerlo solo con
l'interpretazione del contesto in cui ci troviamo, è proprio in
questo punto che dobbiamo o dovremmo ricorrere nuovamente al libro cartaceo,
o ad un occhio.
3. L'ultima fase di correzione è quella di... leggere il prodotto della
nostra fatica! Questa ultima fase non ha solo lo scopo di farci godere del
prodotto del nostro lavoro, ma ha anche quello di individuare possibili
termini ambigui che l'analisi ortografica non ha saputo individuare. Quante
volte leggiamo "cosi" al posto di "così"? Oppure "mormoni" al posto di
"mormorii"? Oppure "terno" al posto di "temo"? Eccetera. Una cosa
interessante da sapere è quella che i primi due punti può farli solo chi
possiede il libro cartaceo. La terza fase di correzione, se chi ha portato a
termine i primi due punti di correzione lo ha fatto decorosamente, può farla
chiunque
legga il libro.

Questi tre punti sono ciò che dico sempre ai miei utenti di Biblos. Io, come
sai e dici anche tu, sono l'autore dello strumento, di uno strumento di
analisi e correzione. la decisione di adottare il metodo di correzione a cui
sono
arrivato in questi anni è di chi lo strumento lo utilizza.

Termino con un cappello iniziale e finale:
1. Una buona scannerizzazione alleggerisce il lavoro successivo. E intendo
anche quel saper mettere il libro sul piano dello scanner.
2. utilizzare un formato digitale professionale, invece che il semplice
testo, sarebbe ormai molto opportuno. Questo i miei utenti lo sanno. Sono
contento quando qualcuno passa ad adottare questi consigli. Un formato
digitale
mantiene, oltre alla struttura del libro, anche i caratteri originari. I
libri in greco antico sono scritti quasi interamente utilizzando caratteri
unicode. Un simile risultato non si potrebbe ottenere con un semplice testo.
Per mantenere un minimo di compatibilità dei caratteri almeno si dovrebbe
utilizzare il testo UTF8. Ma io nei libri, anche ai fini di stamparli in
Braille, desidero molto di più: che la formattazione rimanga integra e che i
rientri, l'interlinea, l'allineamento ecc. non siano fatti con degli spazi.
Oltre al tocco finale dello stile dei caratteri: tipo, grassetto, corsivo.

Spero che la mia posizione sulla correzione dei libri sia chiara... ed è ciò
che ripeto da anni! [