Prova Tecnica di SiRecognizer UMPC, scritta da Gianluca
Ausilio scelto per la prova tecnica:: Premessa: Comincio questa prova tecnica raccontando come ho conosciuto SiRecognizer e perché ho deciso di acquistarlo.
Mi trovavo a sfogliare le pagine del sito di Handimatica, alla ricerca delle novità che sarebbero state presentate durante l’imminente edizione della famosa fiera.
Svogliato e deluso dalla noia del programma, e dalla presenza dei soliti ausili e delle solite ditte che da tempo non facevano altro che ripresentare le medesime cose ormai “trite e ritrite”, clickando in un’area del sito che non avrebbe dovuto contenere informazioni su ausili per non vedenti, (compresi in seguito trattarsi di un errore), qualcosa aveva calamitato la mia attenzione.
Era appunto la presentazione di Itex e dei suoi prodotti.
Incuriosito, ho cambiato subito parere e ho deciso di partecipare alla manifestazione in cerca di questo nuovo soggetto.
Per mia fortuna, trovai lo stand subito all’inizio del mio percorso, ma quando appresi cosa doveva fare SiRecognizer, reagii in modo molto istintivo e “presi in giro” gli autori affermando: “ma come? Mi distingue le belle donne dai manichini?”.
Compresi l’enorme “gaffe” che avevo commesso. Infatti, non voleva essere un riconoscimento di oggetti tridimensionali in senso letterario, ma appunto si trattava di un OCR di testo applicato ad immagini di oggetti tridimensionali. Tramite una serie di elaborazioni e aggiustamenti, il programma è in grado di sottoporre all’OCR il testo presente su etichette e/o sfondi di ogni genere, sia esso lineare, circolare, dritto, obliquo, colorato, perché questo sia in seguito riconosciuto e letto al non vedente. Ho sottoposto alcuni oggetti provocatori per capire con cosa avessi a che fare, ma fui subito spiazzato. SiRecognizer (che era in quel tempo alle prime beta), fu in grado di leggermi il testo scritto sul retro di un mio antennino gps e sul retro della batteria del mio cellulare, seriali compresi.
Era proprio il sussidio adatto per chi, della propria autonomia, oltre ad un’esigenza, ne fa una scelta di vita.
Comprai la versione da tavolo e a distanza di un’anno ho comprato anche la versione portatile.
Il mio intento, attraverso questa prova, è di focalizzare cos’è SiRecognizer esattamente e quali potenzialità offre, non mancando di evidenziare cosa ancora rimane difficoltoso o cosa necessita di ulteriore sviluppo.
Descrizione:: Come si presenta
SiRecognizer è un sistema composto da vari elementi. La parte principale è costituita da un apposito software dall’interfaccia amichevole (della quale parleremo dopo), che si occupa di accogliere le immagini provenienti da differenti fonti e che incorpora il vero motore di riconoscimento e di trattamento delle immagini. La fonte principale è la fotocamera digitale, mentre in alternativa abbiamo lo scanner tradizionale e il caricamento diretto delle immagini/foto/pdf.
Non mi soffermerò molto sulle ultime due, perché abbastanza simili a ciò a cui siamo già stati abituati da altri software di riconoscimento caratteri.
Se ci limitiamo a considerare il software, parliamo di Si Recognizer Professional, nella versione da tavolo, poiché necessita di un pc per poter funzionare.
Il prodotto Si Recognizer UMPC, invece è la versione trasportabile del sistema, poiché l’applicazione è installata su un computer UMPC dalle dimensioni superiori a quelle di un palmare, ma molto inferiori a qualsiasi notebook o tabletPc.
Potete leggerne le caratteristiche in questa parte del sito:
http://www.spazioausili.net/sistemi_di_lettura/sirecognizer_umpc
Tra gli accessori, invece degno di nota in questa prova tecnica, è il cubo per fotografare che non è altro che una struttura in plexiglass voluta per assistere e facilitare le operazioni di scatto ad un non vedente, grazie agli accorgimenti adottati per eliminare riflessi ombre o in generale disturbi che possono compromettere l’ottimale operazione di OCR.
La fotocamera, è accuratamente selezionata dalla ditta perché risponda a determinate caratteristiche di qualità. Tra le più importanti ricordo l’autofocus, lo stabilizzatore d’immagine e una risoluzione pari o superiore a 5 megapixel.
Come potete capire, il sistema è completamente configurabile e personalizzabile e si presta in futuro ad aggiornamenti sia hardware che software.
Per questa prova, utilizzerò SiRecognizer UMPC , composto da fotocamera Nikon s500, UMPC Samsung Q1 Ultra e uno Scanner Canon.
Interfaccia <
L’interfaccia semplice, composta da una fila di pulsanti, un’area di sola lettura, nella quale, vengono poi mostrati i risultati, da un controllo per lo scorrimento delle pagine (solo nella versione da tavolo), e dalla classica barra dei menu con le opzioni proprie di questa applicazione, non presenta particolari problemi d’accessibilità.
Usando jaws 8, tutto viene seguito correttamente, tranne qualche volta nell’area di lettura che pare non presentare una classe dell’oggetto familiare a questo screen reader.
Col braille abbiamo qualche problema in + soprattutto nel focalizzare i controlli in modo fluido e preciso, e addirittura si verifica uno strano bug su ogni prima opzione di menu, che, se pur vocalizzata, non appare sul display.
Suppongo che tali inconvenienti, si verifichino a causa dell’ambiente di sviluppo utilizzato per scrivere SiRecognizer.
Infatti, penso trattarsi di Microsoft framework, che attualmente non è completamente supportato dagli screen readers.
Nvda, non presenta nessun ostacolo a patto che si utilizzi la versione allegata alla sua scheda tecnica su questo sito o non si chieda a Itex di fornire la build appositamente compilata, perché Nvda riconosca ogni controllo di SiRecognizer.
Utilizzando invece la sintesi inclusa col pacchetto, tutto viene prontamente vocalizzato, ma non in modo completo come ci si aspetterebbe e come avviene utilizzando gli screen readers citati sopra.
In particolare, non sono riuscito a impostare lo scanner, perché la sintesi ha smesso di parlare e non sono stato in grado di riascoltare la finestra di editing senza spostare altrove il fuoco per poi riportarlo indietro.
L’ultima nota abbastanza curiosa è che non tutte le voci di menu sono tradotte in italiano e quando lo sono, è grazie agli script allegati con jaws.
Non sono presenti il menu d’aiuto e una guida in linea, dei quali se ne sente la mancanza, considerato il fatto che fino ad oggi non ci sono stati programmi simili e che la materia è completamente nuova anche per chi “bazzica” da tempo nel mondo dell’informatica.
Acquisizione da scanner e da immagini o pdf caricati
Pur non essendo tra le caratteristiche principali e fondamentali del programma,tramite queste due operazioni, otteniamo risultati davvero degni di nota. Non possiamo disporre di tutte le funzioni presenti in un programma tradizionale, come ad esempio dizionario, controllo ortografico ed editing del testo riconosciuto, ma la semplicità dell’interfaccia e l’immediatezza dei comandi rendono le operazioni davvero pratiche in svariate situazioni, come ad esempio il riconoscimento in tempi rapidi di posta cartacea o bigliettini da visita ETC. La configurazione delle caratteristiche di scansione è completa e l’acquisizione di + pagine è efficace poiché, senza dover decidere nulla a priori, basta semplicemente premere la barra spaziatrice per acquisire un nuovo foglio. Possibile anche il riconoscimento differito.
Per quanto riguarda il caricamento di immagini (quindi non foto), ho provato spesso ad importare immagini di scarsa risoluzione trovate in pagine web. Nel caso di numeri verdi o indirizzi o informazioni mostrate tramite “gif” anziché scritte, ho potuto recuperare nella maggior parte dei casi, ciò che mi serviva. Purtroppo sui box anti hacker, non si ottengono risultati soddisfacenti a causa delle distorsioni volute per confondere anche l’occhio umano.
Sui pdf abbiamo una delle vere sorprese presenti in questo prodotto. Ho potuto riconoscere con soddisfazione, bollette , fatture o documenti anche già teoricamente accessibili con acrobat reader, ma comprendenti tabelle che solo tramite il riconoscimento ho potuto consultare.
Ottime le opzioni di esportazione che possono contare su un numero davvero esteso di formati.
Non penso ci si debba aspettare di più per funzioni così secondarie rispetto allo scopo primario del software. Risulta comodo, tuttavia poter disporre anche di queste in un ambiente unico e dall’utilizzo immediato.
Scatti con la fotocamera: risultati e considerazioni
Ho compiuto diversi test attorno alla fotocamera, per capire meglio, in presenza di scarsi risultati, se imputare questi a limiti oggettivi degli algoritmi, a problemi nell’utilizzo della fotocamera da parte di un privo della vista, o se la mancanza del cubo in plexiglass costituisce un insormontabile ostacolo.
Ho rinunciato a quest’ultimo strumento, per motivi di spazio, di praticità, ma anche per sviluppare capacità tali da poter acquisire foto in ambienti diversi e in condizioni disparate.
Infatti, da prove che avevo fatto o alle quali avevo assistito in molte dimostrazioni, appariva chiaro che nel cubo fosse ricreata la situazione ottimale per scattare foto precise e chiare dalle quali fosse possibile trarre i migliori risultati.
NEI casi come il mio, vengono forniti degli speciali filtri, montati sulla fotocamera, per trarre le stessefacilitazioni del cubo almeno per quanto riguarda luce eriflessi. Per la direzione dello scatto, la messa “in asse” dell’inquadratura e la sua centratura, senza cubo, non c’è nulla a disposizione che non le proprie capacità e le indicazioni che durante il corso o assieme alla consegna del prodotto vengono fornite.
Possiamo, tuttavia contare su suggerimenti che il software fornisce dopo il primo scatto, su come spostare la fotocamera per migliorare la foto.
I primi risultati furono pessimi e scoraggianti. Ottenevo scarsi riconoscimenti anche su cose semplici. La mancanza d’esperienza e del cubo si facevano sentire. Seguendo però scrupolosamente le avvertenze dei produttori, e sforzandomi di ricreare le condizioni di scatto necessarie, ho cominciato a raccogliere successi significativi.
Scatto dopo scatto il posizionamento dell’oggetto davanti alla fotocamera, mi appariva come un’operazione naturale tranne che per oggetti più complessi come bottiglie o in generale cose circolari e alte per le quali è difficile prendere punti di riferimento.
Ho provato il riconoscimento del retro di un cd, prima dalla foto e poi dallo scanner. Quest’ultimo mezzo fornisce risultati più puliti, ma riconosce soltanto le scritte principali, mentre tramite foto, con qualche “sporcizia” ho potuto recuperare tutte le informazioni presenti.
Da confezioni di medicinali o del latte, ho letto scadenza, ingredienti o composizione del prodotto.
Sulle bottiglie, invece, qualche manovra in più mi è occorsa, ma le 9 strategie d’elaborazione sulle quali possiamo contare, hanno permesso comunque di recuperare ciò che ci si aspettava.
Uso molto il termine recuperare, perché è chiaro che non otteniamo copie conformi delle etichette, ma spesso una buona percentuale di conformità mischiata a “sporco (caratteri incerti o non esistenti) che ciò nonostante bastano a capire il senso del testo.
A volte, ciò che non viene mostrato col primo scatto, viene poi ottenuto tramite le strategie di riconoscimento successive.
Le cose cambiano, quando si ha l’ambizione di voler fotografare oggetti in mobilità o in generale tenendo la fotocamera lontana da un piano d’appoggio.
Probabilmente il sottoscritto non è molto abile a tenere la macchina in asse, ma coll’esperienza qualcosa si riesce a migliorare.
I primi giorni ho abbandonato ogni speranza, ma in ultimo ho preso coraggio e ho cercato di fotografare i cartelli che mostrano gli orari del bus.
Chi ha potuto controllare i risultati, mi conferma trattarsi di foto storte o mezze tagliate. SiRecognizer, invece tramite un primo raddrizzamento e qualche altra rielaborazione, ha in modo insperato riconosciuto l’elenco degli orari con la chiarezza sufficiente per la necessaria consultazione.
Mi riserverò di fare altre prove in futuro, soprattutto quando personalmente mi sentirò completamente disinvolto nell’effettuare le foto.
Conclusioni:: Siamo di fronte ad un prodotto interessante che, a mio avviso, centra gran parte degli obiettivi fissati. Adatto a chi vive da solo per i propri oggetti quotidiani, risolve i bisogni contingenti.
Chiedere a qualcuno di leggerci le etichette è sicuramente ancora la via più rapida, ma spesso le urgenze non ci permettono di aspettare ed ecco che anche se dopo qualche manovra laboriosa, in pochi minuti otteniamo le informazioni attese.
Le 9 strategie di riconoscimento costituiscono il punto forte del sistema, mentre, invece, l’interfaccia e l’utilizzo incompleto senza screen reader, sono i punti deboli.
A questi aggiungo l'assenza di documentazione che non può assolutamente mancare in un pacchetto del genere.
Non posso negare che il supporto di Itex non si fa attendere ed è sempre preciso e puntuale, tuttavia è giusto che anche chi non possiede il prodotto, o chi non abbia tempo di mettersi in contatto con loro, possa poter disporre su help in linea, manuali o tutorial che guidino attraverso questo nuovo strumento per l’autonomia.
Siamo infatti di fronte a concetti difficili ed insoliti che non appartengono al mondo del “non vedere”. Si è obbligati ad astrarre situazioni o nozioni totalmente privi di senso per chi, ad esempio non ha mai visto.
SiRecognizer Attualmente è un sistema trasportabile,ma non completamente utilizzabile in mobilità.
E’ comodo poter scattare foto da importare e riconoscere in un secondo momento, ma l’utilizzo diretto è ancora un po’ scomodo.
Speriamo in futuro di poter contare su un hardware all in one, compatto che permetta l’uso di SiRecognizer in ogni situazione.
Del prezzo non ho parlato poiché esula dagli scopi di questa prova. Tuttavia, mi pare costituisca un ostacolo, per chi non riesca a contare su qualche contributo in sussidio.
La ricerca che sta alla base di SiRecognizer merita di essere sostenuta e probabilmente giustifica o spiega il motivo di tale importo elevato.
Di fronte però all’abbattimento delle barriere che ci legano ancora alla dipendenza di qualcuno che vede, non sono convintoci si possa fermare ad una mera questione di prezzo.
Ad esempio, i cartelli dei bus, avrei potuto farmeli leggere, ma non considerando il fatto che ora, posso archiviare gli orari per la loro consultazione in ogni momento mi occorra, avere fatto tale operazione in completa autonomia, credetemi, ha tutto un altro sapore!!
|
prova SiRecognizer
e dove sarebbe la prova? Non ho mai letto niente di meglio per demolire un prodotto.
Ti ringrazio del commento.
Ti ringrazio del commento. Peccato tu rimanga anonimo togliendo valore allo stesso. Qualcuno addirittura mi accusa di compiere "spudoratamente" un atto promozionale nei confronti del prodotto. Evidentemente se, come scrivo, posseggo entrambe le versioni è chiaro che ritengo trattarsi di uno strumento efficace. Riconoscere che centra i propri obiettivi, che funziona come supporto alle necessità quotidiane e che ti permette di raggiungere l'autonomia tanto inseguita, mi pare possa essere merito d'orgoglio per qualsiasi produttore. Nella logica di un servizio offerto agli utenti, non mi pareva utile riportare una "passerella" di successi, ma al contrario chiarire le idee su aspetti che difficilmente possono esser trattati durante le dimostrazioni o lette da foglietti illustrativi.
Se avremo il piacere di conoscerti, ti aspettiamo nel nostro forum per capire cosa non trova il tuo consenso e cosa ti aspetti da una prova tecnica. Siamo sempre disposti a migliorare.
Anc'io ritengo come te, che
Anc'io ritengo come te, che questo prodotto sia interessante e soprattutto utile. Spero di poterlo andare a provare al più presto. Mi piacerebbe che ne venisse prodotta una versione anche per cellulari, come il Kfnb Reader.