Il test del Nuance Dragon Naturally Speaking 9

L’addestramento è ora facoltativo. Migliorata la precisione di riconoscimento e supportati i file MP3 scaricati da registratori o palmari

Dicembre 2006 Continua a ritmo costante lo sviluppo di nuove versioni
di Dragon Naturally Speaking, l’attuale leader nel campo del riconoscimento
vocale. La nuova versione 9 presenta diverse novità rispetto alla release
precedente, tra cui aumento della precisione di riconoscimento, nuovi comandi
per Outlook Express, Word e WordPerfect, supporto microfoni senza fili Bluetooth,
nuove esercitazioni, modalità “immediatamente operativi”
senza necessità di addestramento, supporto formato MP3 con relativo aumento
di tipo e numero di dispositivi mobili utilizzabili per registrare appunti vocali
da convertire in testo (registratori vocali, palmari e lettori MP3).

Interessanti ci appaiono la possibilità di iniziare subito a dettare
saltando la lettura di testi di addestramento, ed il supporto del formato MP3,
che apre un’intera gamma di nuove possibilità, legate alla sempre
più capillare diffusione dei player MP3 sul mercato, la maggioranza dei
quali ha funzioni di registrazione. Infine, il miglioramento della precisione
è sempre gradito, anche se inferiore al “salto” di ben il
20% dalla versione 7 alla 8, occasione in cui furono profondamente rielaborati
gli algoritmi di riconoscimento ed ampliati i modelli linguistici.

Le tre versioni
La versione Preferred, testata in questa occasione, include una cuffia/microfono
e aggiunge il riconoscimento di file WAVE PCM, ADPCM, a-law/mu-law, VOX ed MP3
scaricati da registratori vocali portatili, palmari o lettori MP3, e la rilettura
con sintesi vocale o con la nostra voce originale. La Preferred Mobile è
identica alla Preferred ma include anche un registratore portatile Philips.
La versione Professional ha in più salvataggio audio originale assieme
al testo, creazione vocabolari personalizzati, linguaggio script, funzioni di
rete e supporto avanzato applicazioni.

Il riconoscimento vocale: quando serve davvero
Il riconoscimento vocale consiste nell’elaborare l’audio proveniente
da una voce umana tentando di distinguere i suoni delle singole parole, che
una volta riconosciute possono essere usate in due modalità: impartire
comandi al computer o inserire testi all’interno di applicazioni. L’esecuzione
di comandi impartiti con la voce realizza il vecchio sogno di parlare a un computer,
anche se ovviamente non si tratta di HAL di “2001: Odissea nello Spazio”,
ed il computer anche se esegue i nostri comandi non è (fortunatamente…)
dotato di coscienza che gli consenta di “comprenderli” veramente.

Lasciando da parte la fantascienza, la possibilità di comandare il PC
con la voce è comunque di notevole utilità in diverse situazioni,
e può diventare addirittura indispensabile in caso di gravi disabilità
che impediscano di utilizzare mouse e tastiera, o anche in caso di patologie
derivanti proprio dal loro uso come la nota sindrome del tunnel carpale.
La dettatura di testi all’interno delle applicazioni consente invece di
inserire testi in un word processor o in altri software semplicemente parlando.

Va però ribadito che la precisione di riconoscimento è ancora
nettamente inferiore a quella di un OCR, che va preferito in tutti i casi in
cui il testo è già in forma stampata. Con i testi manoscritti
o nel caso di dettatura “a braccio” di testi non scritti il riconoscimento
vocale è invece estremamente prezioso, risultando comunque più
rapido e meno faticoso della digitazione con la tastiera.
La comodità diventa ancora maggiore nel caso di riconoscimento di appunti
vocali memorizzati su registratori vocali portatili, palmari, smartphone o lettori
MP3: basta dettare il testo desiderato dovunque ci troviamo, per poi “scaricarlo”
sul computer e convertirlo in testo pronto da stampare con una sola operazione.

Precisione in aumento
Tra Dragon 7 e Dragon 8 registrammo un eccezionale incremento
della precisione, dal 90,3% al 98,8%, ovvero il numero di errori in una pagina
come quelle di PC Open interamente testuali (circa 1.000 parole) scese da 97
a 12. Ciò segnò addirittura un punto di svolta nella reale utilità
di software di questo tipo, in quanto con 97 parole riconosciute erroneamente
per pagina non si poteva certo pensare ad un utilizzo proficuo al posto della
digitazione da tastiera, mentre con le sole 12 parole errate per pagina di Dragon
8 esso risultò effettivamente una soluzione efficiente.

Dopo quel “salto” non ci si aspettava incrementi altrettanto vistosi,
ma c’è stato comunque un miglioramento percepibile: Dragon 9 ha
fatto registrare una precisione del 99,1% ed il numero di parole errate per
pagina è sceso da 12 a 9. I nostri test hanno però mostrato risultati
estremamente lusinghieri nel riconoscimento di pagine dal lessico ricercato,
vale a dire con parole non di uso colloquiale (testi letterari, scientifici
ecc.). Qui la precisione di Dragon 9 è risultata del 98,6%, contro il
97,2% di Dragon 8.
Dunque, anche leggendo testi con parole poco comuni Dragon 9 ha un’ottima
efficacia, commettendo circa 14 errori per pagina contro i 28 di Dragon 8.

In conclusione con software come Dragon 9 il riconoscimento vocale è
ormai un’applicazione non più “pionieristica”, ma effettivamente
utilizzabile in modo produttivo, anche se dobbiamo ricordare che nel caso di
testi stampati l’OCR risulta sempre più rapido e preciso: OmniPage
15 con la stessa pagina da 1.000 parole in cui Dragon 9 commette 9 errori riesce
a commetterne solo uno o due, a seconda della qualità dei caratteri stampati.

Addestramento facoltativo
Calibrato il microfono e misurata la qualità dell’ingresso audio
tramite misurazione del rapporto segnale/rumore, come da tradizione il primo
passo è la creazione del profilo vocale di uno o più utenti, tramite
lettura di un brano a nostra scelta tra quelli proposti, e non manca il solito
Pinocchio che ci segue dalle prime versioni di Dragon. A partire dalla versione
8 il tempo di addestramento è stato fortunatamente ridotto da 30 a 5
minuti, ma la novità di questa versione 9 è la modalità
“senza addestramento”, che consente di iniziare subito a dettare
senza dover leggere alcunché. Ideale per chi ha necessità di un
uso immediato, è sconsigliata da Dragon perché la mancanza del
confronto preliminare tra un testo noto ed il nostro modo di leggerlo dovrebbe
abbassare la precisione di riconoscimento, ma nei nostri test non c’è
stata praticamente differenza nella precisione tra un utente senza addestramento
e lo stesso utente con addestramento. Inoltre va ricordato che Dragon si “auto-addestra”
durante l’uso normale, in base alle correzioni che effettuiamo.

Dattilografia personale
Dettare testi con Dragon è molto semplice: si può utilizzare il
word processor dedicato incluso chiamato DragonPad, o utilizzare i soliti Word,
WordPerfect, OpenOffice e così via. Basta attivare il microfono e parlare
a velocità normale. Le frasi pronunciate appaiono prima in una finestra
pop-up, per poi essere inserite nel testo a ogni pausa. È possibile selezionare
zone di testo ed eseguire operazioni di editing interamente con la voce. Nel
caso di errori risulta particolarmente utile la rilettura con la nostra voce:
Dragon ci farà riascoltare la nostra voce campionata, così potremo
essere sicuri di cosa abbiamo detto nel caso di dettatura “a braccio”.
In ogni caso è presente anche la rilettura tramite voce sintetizzata.
La DragonBar in alto, finalmente rivista nel look, ci fornirà accesso
a tutte le funzioni del software. Unico difetto: con Dragon attivo, l’interfaccia
di Windows e l’apertura di applicazioni e documenti rallentano in modo
sensibile, per esempio un documento Word, che normalmente si carica in 2 secondi,
ne impiegherà circa 4.

Anche per il web
Oltre alla dettatura Dragon offre la possibilità
di controllare il PC con la voce, di importanza capitale in caso di disabilità.
Ad esempio se si dice “Esegui Microsoft Word” questo verrà
lanciato, per aprire un file basta dire “File Apri
e poi pronunciare il nome del file, e lo stesso vale per tutte le funzioni da
menu.
Particolarmente comoda è la navigazione web: basta pronunciare la prima
parola di un link e questo verrà indicato da una freccia rossa e subito
aperto, per muoversi basta dire a Dragon di salire o scendere nella pagina,
e così via. Una navigazione interamente senza mani!

Pro
-Eccellente percentuale di riconoscimento
-Controllo vocale di applicazioni e navigazione web
-Conversione da registratore vocale o lettore MP3

Contro
– Non raggiunge la precisione di un OCR
– Requisiti di sistema raddoppiati rispetto alla V. 8

Caratteristiche tecniche
Nome: Dragon Naturally Speaking 9
Produttore: Nuance
Sistema Operativo: Windows 2000 SP4/XP SP1 o succ.
Configurazione minima: Pentium 1 GHz (cons. 2,4 GHz), 512 MB
ram, 1 GB su hard disk, scheda audio a 16 bit, conness. web per l’attivazione
Prezzo: 99 euro (Standard), 299 euro (Preferred), 799 euro (Professional)

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome