Alla ricerca del file perduto

Il test di PaperPort 10 e Documind Pro 5.0 Pro, software indicati per ricercare, archiviare e visualizzare documenti memorizzati sul PC

Ottobre 2005 I software di gestione documenti hanno lo scopo di organizzare
e visualizzare con un’interfaccia unica la maggioranza dei file presenti
nel nostro PC, senza la necessità di utilizzare le singole applicazioni.

Pensiamo ad esempio alle informazioni raccolte su un progetto di lavoro, che
possono essere formate da alcuni documenti Word, altri in formato PDF, più
alcune immagini JPEG ed un paio di pagine HTML.

Per vedere la documentazione dovremmo utilizzare Word, Acrobat Reader, un
software di grafica ed un web browser. Ben quattro programmi da lanciare con
perdita di tempo, scomodità e, con i computer meno performanti, rallentamento
delle operazioni.

Con un software di gestione documenti possiamo invece lanciare solo un programma,
che potrà visualizzare tutti questi file in un’unica interfaccia,
ed organizzarli in comode cartelle.

Altra funzione importante è quella di “motore di ricerca interno”:
i migliori software di gestione documenti sono infatti dotati di una sezione
apposita, organizzata come un motore di ricerca Web, ma in grado di eseguire
la ricerca all’interno del nostro PC, ad esempio per trovare tutti i documenti
in cui appare una determinata parola.

Infine, questi programmi sono dotati di una potente sezione di acquisizione
dei documenti, che possono essere salvati in diversi formati con o senza l’esecuzione
dell’OCR, ovvero della conversione delle pagine testuali in file di testo
editabili.

Non per niente i principali produttori di software di gestione documenti sono
i leader nel campo dei software OCR, come ScanSoft e ABBYY/Novadys.

Visto che diverse funzionalità sono sovrapponibili abbiamo deciso di
confrontare questi due programmi, verificando di volte in volta quale risponde
meglio alle varie esigenze.

Esigenze che si possono riassumere in acquisizione, OCR, archiviazione, condivisione,
conversione e ricerca, da esercitare sulla gamma di file il più possibile
ampia: testi, immagini, fogli elettronici, pagine Web e così via. Vediamo
come si comportano questi programmi nei vari ambiti di utilizzo.

Installazione e configurazione
Documind Professional si installa senza problemi
e non richiede attivazione.

Possiamo decidere se installare o meno il PlugIn di Documind, che ne integra
le funzionalità in Outlook 2000/XP ed in Internet Explorer.

Dopo l’installazione viene richiesto di eseguire la configurazione,
che effettua una ricerca dei documenti presenti sul nostro PC e ne esegue l’indicizzazione.

Documind richiede di inserire manualmente in quali cartelle dovrà ricercare
i documenti e quali invece escludere, dopodiché l’aggiornamento
con i nuovi file inseriti potrà essere automatizzato.

A differenza di PaperPort è possibile eseguire un’indicizzazione
rapidissima senza la ricerca testi all’interno delle immagini tramite
OCR: abbiamo indicizzato una cartella da 3 GB contenente più di 600 sottocartelle
e 5.000 file in solo un minuto.

Se invece si esegue una ricerca con OCR delle immagini, simile a quella di
PaperPort, i tempi sono sovrapponibili: circa un’ora.

L’indicizzazione è obbligatoria per poter eseguire ricerche,
in quanto il cuore di Documind è un archivio interno che consente di
rendere le ricerche fulminee (solo un secondo).

L’installazione di PaperPort 10 richiede sia l’inserimento del
numero di serie sia l’attivazione del software via Internet, in stile
Microsoft. Se non si attiva il software potremo lanciarlo solo per cinque volte,
dopodiché cesserà di funzionare.

La configurazione a differenza di Documind non richiede la ricerca preliminare
dei file testuali, grafici e via dicendo presenti sul nostro sistema, che sarà
avviata solo se faremo partire il modulo motore di ricerca.

L’inserimento dei documenti da gestire avviene infatti manualmente,
trascinando le cartelle in cui sono contenuti in PaperPort, o trascinando i
documenti nelle cartelle predefinite di PaperPort.

Una nota negativa va al fatto che le cartelle predefinite non sono state riorganizzate
per il nostro paese, ma ne è stato semplicemente tradotto il nome, per
cui ci troviamo cartelle come quella 401K, dedicata al sistema pensionistico
statunitense.

Dovremo dunque creare manualmente le cartelle adatte alle nostre attività.

Motori di ricerca interni
Documind ha come punto di forza il potente motore
di ricerca interno, in grado di trovare il file ricercato in tempi rapidissimi
(circa un secondo) e con filtri molto sofisticati.

L’interfaccia di ricerca è formata da due sezioni: sulla sinistra
la maschera di ricerca, sulla destra la finestra di visualizzazione dei documenti.

La maschera di ricerca comprende campi per la ricerca di testo all’interno
dei documenti e nei nomi di file, per la definizione di date, percorsi e formati
dei file da ricercare, una cronologia, ed un cursore per regolare il Fuzzy level.

La ricerca Fuzzy serve per trovare termini simili a quello inserito, utile
quando non si ricorda esattamente la parola ricercata.

Da notare che di default Documind trova i termini che differiscono per un
solo carattere, ovvero se si inserisce “mattina” troverà
anche le occorrenze di “mattine”.

Nelle nostre prove Documind ha mantenuto le promesse velocistiche: la ricerca
tra le 600 cartelle ed i 5.000 file indicizzati, di cui molti sono documenti
testuali composti di migliaia di caratteri, è sempre avvenuta praticamente
in tempo reale, con comparsa dei risultati in meno di un secondo. Risultati
che possono essere visualizzati come tabella o ad albero, con percentuali di
corrispondenza.

Infine, da notare le potenzialità di ricerca con OCR, ovvero è
possibile ricercare parole all’interno di immagini, che vengono sottoposte
automaticamente ad OCR, cosa particolarmente utile indicando a Documind una
cartella contenente fax, le cui immagini vengono trasformate in testi ricercabili.

Anche PaperPort è dotato di una potente sezione di ricerca, che si
attiva dal menu Strumenti ed è chiamata All-in-One Search.

Come in Documind è necessaria una preventiva indicizzazione dei file,
che include però di default la ricerca di testi all’interno di
immagini tramite OCR, dunque impiega gli stessi tempi dell’indicizzazione
con OCR di Documind (circa un’ora per 600 cartelle con 5.000 file), mentre
Documind dispone anche dell’indicizzazione rapida senza includere l’OCR
delle immagini che ha impiegato solo un minuto.

Una delle caratteristiche più potenti di All-in-One Search è
la possibilità di ricercare testo all’interno di immagini, sottoponendole
automaticamente ad OCR, funzionalità meglio implementata rispetto a Documind
e che consente, trattando le immagini come fossero documenti testuali, di trovare
una parola all’interno di immagini acquisite da scanner ed archiviate,
oppure catturate da un sito web.

Nella figura nella pagina successiva si vede come la parola “nero”
sia stata trovata all’interno di un file TXT, di un file PDF e di un file
TIFF.

Di quest’ultimo è visibile l’anteprima in alto, e cliccandola
potrà essere visualizzata a schermo intero in PaperPort.

Se nell’indicizzazione la rapidità di Documind è enormemente
superiore, nella ricerca all’interno dei file indicizzati PaperPort si
difende bene: per ricercare un termine nelle stesse 600 cartelle con 5.000 file
utilizzati per Documind, PaperPort ha impiegato tempi intorno ai due-tre secondi,
contro una media di meno di un secondo in Documind, che in ogni caso resta insuperabile.

continua…

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome