Questa nuova versione offre il controllo completo delle funzioni del computer tramite la voce, caratteristica molto utile in caso di disabilità. Da non trascurare la velocità di addestramento e la rinnovata precisione nel riconoscere il parlato colloquiale.
Aprile 2005 Il riconoscimento vocale è uno dei campi più affascinanti dell’informatica: un computer che riconosce la lingua parlata è infatti tra i grandi sogni di scienza e fantascienza.
La cosa è ovviamente di grande utilità nel campo delle disabilità: chi non è in grado di usare tastiera e mouse con software come questi può controllare il PC (lancio di applicazioni, comandi da menu ed inserimento testi) con l’uso della sola voce. Inoltre chi soffre di patologie come la sindrome del tunnel carpale può evitare l’utilizzo intensivo di mouse e tastiera che spesso ne costituisce la causa.
L’altro grande campo di utilizzo è quello della dettatura di testi, in cui il riconoscimento vocale si pone come alternativa alla digitazione da tastiera, un po’ come il riconoscimento ottico OCR.
La cosa è però molto più complessa: vista la grande varietà di pronunce e toni del parlato umano, l’accuratezza è nettamente inferiore, dunque un testo già esistente in forma stampata è molto più rapido da acquisire tramite OCR, lasciando l’uso del riconoscimento vocale ai testi scritti a mano, dettati o registrati dal vivo.
Abbiamo testato l’ultima versione di Dragon Naturally Speaking, la release 8, distribuita in tre versioni: Standard, Preferred e Professional. La versione Preferred, oggetto di questa prova, ha in più funzioni di riconoscimento di file WAV da registratori vocali portatili o PalmOne/Tungsten/ Pocket PC e rilettura da parte del PC con sintesi vocale.
La versione Professional ha in più creazione di dizionari personalizzati, linguaggio script per automatizzare le operazioni e funzioni di rete. La confezione contiene il software su due CD, un manuale cartaceo in italiano di 200 pagine, ed una monocuffia con microfono che va collegata all’ingresso Mic e all’uscita Line Out della scheda audio.
LA DETTATURA
opo l’addestramento potremo iniziare a dettare nel nostro elaboratore testi (per esempio Microsoft Word) o in DragonPad, l’elaboratore testi incluso. Durante la dettatura le frasi pronunciate saranno visibili in una finestrella popup. È possibile selezionare porzioni di testo pronunciandolo, dopodiché potremo farcelo rileggere, modificarlo, formattarlo in grassetto e così via.
Dragon può rileggere i testi con sintesi vocale o con la nostra stessa voce: basta selezionare un passo e con l’opzione riproduci testo Dragon ci farà riascoltare la nostra voce mentre dettavamo il passo, in modo da poter correggere eventuali errori anche se non ci ricordiamo più cosa abbiamo detto.
INSTALLAZIONE E ADDESTRAMENTO
Finita la fase di installazione, Dragon esegue la calibrazione del microfono misurando il rapporto segnale/rumore, dopodiché va eseguito l’addestramento.
Un tempo era molto lungo e noioso, si doveva leggere per almeno mezz’ora,
mentre Dragon oggi si accontenta di 5 minuti, e la varietà dei testi proposti è stata ampliata: ai soliti passi del Pinocchio collodiano e di Severgnini, visti nelle precedenti versioni, sono state aggiunte raccolte di proverbi e frasi celebri, che rendono più agile la lettura.
L’addestramento è necessario per “abituare” il software alla pronuncia ed al timbro di voce di un particolare utente. E’ possibile creare diversi profili utente ognuno con il suo addestramento, ed è possibile eseguire addestramento supplementare, anche se Dragon continua ad addestrarsi mentre lo utilizziamo.
Inoltre viene eseguito anche un adattamento allo “stile di scrittura”, ricercando sul PC documenti di testo ed e-mail da noi scritte ed analizzandole in modo da sapere in anticipo qual è il nostro stile e quali sono i termini che usiamo di più, migliorando ulteriormente il riconoscimento.
STORIE DI RIVALITA’
La concorrenza nel campo dei software di riconoscimento vocale è praticamente cessata con l’acquisizione da parte di ScanSoft di ambedue i grandi rivali che per anni si erano dati battaglia, ovvero Dragon Naturally Speaking e IBM ViaVoice.
Quest’ultimo non è più aggiornato dalla versione 10 di fine 2002, mentre Dragon ha continuato il suo sviluppo.
La cessione da parte di IBM sembra aver segnato il destino di ViaVoice, il cui antenato Voice Type non riconosceva il parlato continuo, era quindi necessario “parlare-con-pause-tra-una-parola-e-l’altra-come-un-robot”.
Dragon rispose nel 1997 con Naturally Speaking, primo software in grado di riconoscere il parlato naturale continuo.