La sintesi vocale, in inglese speech synthesis, ha la funzione di riportare in voce ciò che appare sullo schermo. I non vedenti fanno un larghissimo uso di questa tecnologia, in quanto risulta molto immediata non solo per la lettura di giornali, libri, articoli etc, ma anche nell'utilizzo di computer e telefoni cellulari nella vita di tutti i giorni.
In passato, i sintetizzatori venivano prodotti come periferiche, dette esterne se da collegare alla porta seriale del pc, oppure interne se da inserire nel computer su scheda PCI: venivano conosciute con il nome di Sintesi Hardware.
Benché ne esistano ancora sul mercato di questi esemplari, la stragrande maggioranza degli utilizzatori ormai si avvale di sintesi software, in grado cioè di riprodurre la voce tramite la scheda audio del Pc.
Le sintesi vocali vengono gestite dagli screen reade], che molto spesso vengono rilasciati con voci interne preconfigurate e pronte all'uso.
Tuttavia, esistono produttori specializzati nella produzione di sintesi vocali relativamente costose, ma dalla qualità eccellente, al punto che ormai vengono impiegate anche in altri servizi, ad esempio sistemi di centralini telefonici automatizzati, o annunci di orario ferroviario.
Per una panoramica delle varie tecniche di sintesi, e per un approccio molto più scientifico alla materia, rimandiamo alla sezione dedicata di Wikipedia.