Salta al contenuto principale

scansione testi e lettore vocale

art. postato da maurizio gabelli su uictech, 19\02\2009, h. 00.35.

vi posto un articolo tratto da pc open che secondo me
potrebbe interessare molti di voi. si parla di un ocr free con alcune
funzioni interessanti. In attesa di provarlo nel week end, lascio agli
smanettoni della lista l'onore di fare i primi test.. eheheh

Ed ora, un po' di pubblicità

:

Salvo specifici casi di attività professionale in ambito editoriale, non
è frequente trovare persone che utilizzano ogni giorno un programma di
OCR (Optical Character Recognition). Nel momento in cui diventa
necessario recuperare testo da un'immagine per incollarlo in altri
documenti, però, è importante averne uno che sia agevole da utilizzare
ed efficiente nelle funzionalità.

Perché un OCR sia valido, il primo requisito da possedere è l'efficacia
del riconoscimento. In mancanza, si rischia di impiegare tempo in
operazioni che conducono a un esito finale insoddisfacente. Proprio per
questo, chi ne ha bisogno di solito acquista uno dei programmi più noti,
in commercio da anni, spesso con un costo di acquisto non propriamente
basso.

TopOCR, invece, è freeware. Ciò nonostante, svolge il suo compito con
semplicità e buoni risultati. Tra l'altro, oltre al puro riconoscimento
del testo, integra un certo numero di strumenti aggiuntivi.
Utilizzandoli, si migliora la qualità del lavoro e si ottiene una più
comoda fruizione dei risultati.
Tra essi ci sono la lettura del testo attraverso gli altoparlanti, la
generazione di file audio MP3 e l'acquisizione di immagini da cellulari
e da altre periferiche.

Il modulo OCR
Nella fase di lettura, TopOCR riconosce testo appartenente a undici
lingue, tra cui l'italiano e quelle occidentali più diffuse: inglese,
francese, spagnolo e tedesco. Non gestisce lingue come arabo, cinese e
giapponese.
Lanciandolo in esecuzione, si aprono due finestre affiancate che
rimangono agganciate tra loro anche quando se ne sposta una sul Desktop.
In quella di sinistra avviene il riconoscimento dei caratteri. Quella di
destra, TopOCR Text, corrisponde a un vero e proprio programma di
gestione testi.

Quando si apre il file di un'immagine, il programma ne visualizza il
contenuto nella finestra di sinistra e lancia immediatamente il motore
di riconoscimento del testo. Il risultato dell'elaborazione viene
visualizzato sulla destra, dove può essere corretto e modificato a
piacere.
Per evitare di sottoporre l'intera immagine al motore di conversione da
immagine a testo, se ne può delimitare un'area rettangolare con il
mouse. Successivamente la si copia e la si incolla nella finestra di
sinistra, in modo da lanciare il riconoscimento del testo solo nella
zona che interessa.

Secondo il produttore, la qualità del riconoscimento può raggiungere la
percentuale del 99,8%, a patto di avere un'immagine di partenza di buona
qualità. Un modo per migliorare la percentuale è ingrandire il testo con
un fattore di zoom 2x o 4x. Nel programma, l'intervento può essere
eseguito con uno dei comandi del menu Image ed essere ripetuto più
volte. Oltre che in formato testo TXT, in uscita il programma genera
file nei formati RTF, PDF e HTML.

TopOCR integra anche la funzione di acquisizione diretta di immagini da
scanner, da webcam o da altri dispositivi di cattura immagini, purché
abbiano interfaccia standard TWAIN.

Funzioni di TopOCR Text
Le funzionalità sono del tutto analoghe a quelle di un programma di
gestione testi. Si possono formattare caratteri e paragrafi e gestire
elenchi puntati e numerati. In ogni pagina si possono inserire immagini,
semplici tabelle e interruzioni di pagina. Inoltre, si possono gestire
intestazione e pie' di pagina e inserire campi il cui valore viene
generato automaticamente, come la data di sistema o il numero della
pagina corrente.

Una funzione utile è TextToSpeech. Attivandola, il testo viene
riprodotto ad alta voce per ascoltarlo attraverso gli altoparlanti o le
cuffie. La voce predefinita in Windows, però, ha inflessione in inglese
(Microsoft SAM). Per ascoltare il testo con dizione in italiano, occorre
installare il relativo motore di riproduzione audio. Uno prelevabile
liberamente è disponibile a questo indirizzo Internet.

Un'altra interessante funzione di TopOCR Text permette di registrare la
lettura audio del testo in un file. Si può generare un file WAV e, da
esso, un MP3 da ascoltare quando e dove lo si desidera, magari con un
cellulare o con un riproduttore tipo iPod.
Ne consegue una comodità da non trascurare per chi viaggia di frequente
o si sposta in tragitti di una certa durata da un posto a un altro.

Aperto al mondo del lavoro
TopOCR è stato sviluppato anche per recuperare testi da immagini
catturate con fotocamere digitali o da cellulari, purché i dispositivi
abbiano un obiettivo di almeno 3 Megapixel e l'illuminazione del
supporto di partenza sia corretta. Nel caso contrario la qualità
dell'immagine potrebbe non essere sufficiente per garantire un corretto
riconoscimento. In ambito lavorativo la caratteristica può essere
sfruttata per acquisire le scritte stampate sui biglietti da visita e
ridurre il tempo necessario per inserirle nella propria rubrica
informatizzata.

Un altro impiego potrebbe essere l'acquisizione di testi da documenti
cartacei ricevuti in una riunione di lavoro o consegnati da
interlocutori istituzionali, per inviarli telematicamente al proprio
ufficio in tempo reale.
Anche per questo, del programma esiste una versione installabile in un
palmare/smartphone con Windows Mobile 6.0 e interfaccia Web. Con questa
configurazione, si può acquisire un testo al volo per inviarlo come
allegato in posta elettronica o direttamente a un server Web in
Internet.

Nella pagina Web http://www.topocr.com/mtutorial.html sono pubblicati
diversi consigli su cosa fare per avere una buona immagine da convertire
in testo.
Dalla stessa pagina si può prelevare un file PDF con una pagina campione
da utilizzare per la calibrazione delle periferiche di cattura delle
immagini.

__._,_.___

#1 sintesi italiane alternative a SAM

Ottimo l'articolo, davvero interessante il software di scansione, forse il contenuto della pagina contenente questo articolo sarà stato copiato con un semplice seleziona tutto, copia e incolla, quindi, del link da dove scaricare le sintesi italiane ne è stato copiato soltanto il testo descrittivo.
Chiedo quindi, se, almeno fra parentesi sia riportato l'URL, dato che questa versione di PCCiechi è distribuita anche in formato testo.
Grazie

#2 scaricato ed inswtallato topOCR. Come si scansiona?

AndreaCiao a tutti,
come da oggetto ho scaricato ed installato topOCR, esplorando i menù non trovo la voce per avviare una scansione... MI sapete dire come funziona? Poi, tra l'altro, ho provato a consultare la guida ma sembra inaccessibile...
Cosa mi sapete dire?
Grazie