La data quality parte da un buon database

A margine di un convegno organizzato da Sas sul rapporto fra la qualità dei dati e quella della Business intelligence, Lineaedp ha incontrato Cinzia Cappiello, del dipartimento di Elettronica e Informazione del Politecnico di Milano. Cappiello, che si …

A margine di un convegno organizzato da Sas sul rapporto fra la qualità dei dati e quella della Business intelligence, Lineaedp ha incontrato Cinzia Cappiello, del dipartimento di Elettronica e Informazione del Politecnico di Milano. Cappiello, che si occupa anche di trasferimento tecnologico verso il mondo imprenditoriale, ci ha offerto una spiegazione del concetto di data quality declinata sullo scenario aziendale italiano.

Data quality, diamo una definizione?

«Buona è quella del Mit, “fitness for use”. Ossia, adeguatezza del dato al processo. C’è quindi soggettività. Non si tratta di parlare solo di esattezza del dato in sé, ma anche di aggiornamento, adeguata rappresentazione, attenzione alla multidimensionalità. Quando trattiamo di dati, il rischio che si corre è di non avere una corrispondenza con la realtà d’azienda».

Esiste una scala per ordinare i processi aziendali?

«Non c’è una vera gerarchia. Si vedono i processi in relazione all’impostazione aziendale. Prima viene il core business, a cui sono associati i dati elementari. Sono anche i processi più prevedibili e gestibili dal punto di vista It. Poi vengono i processi decisionali e quelli strategici, che collezionano i dati partendo dai processi operativi, e qui ciò che muta è la strutturazione. Quello decisionale non è strutturato; i dati cambiano e non sono più elementari, ma trasformati. E se si ha un errore a livello operativo, la scarsa qualità del dato si trasmette al resto. La data quality, allora, interessa tutti i processi, ma parte dal basso. E il fondamento è il database, che è la prima cosa che deve essere fatta bene. Ne sanno qualcosa gli americani, che hanno varato il Data Quality Act. Ora il tema comincia a essere sentito anche in Italia. A volte i problemi a livello operativo sulla qualità dei dati non si sentono, ma quando si affrontano i processi decisionali vengono a galla. Siamo a conoscenza di diverse horror story che denunciano questo problema».

I manager italiani hanno chiaro il valore della Business intelligence? La sanno maneggiare?

«Al momento da noi sono poco sfruttate le funzioni avanzate. Poi non so quanto tutti riescano ad apprezzare il valore del data mining. È anche vero che non è proprio adatto a tutti gli utenti. I manager italiani devono insomma apprezzare di più la tecnologia a loro disposizione. Al momento sono troppo legati al core business e badano soprattutto al beneficio immediato».

Quali sono le pratiche che influiscono sulla qualità e il governo dei dati?

«Se un’azienda vuole perseguire la data quality deve fare due cose. Primo, darsi uno strumento per pulire i dati e fare profiling. Sintatticamente è facile, più difficile è fare controlli semantici. Secondo: deve controllare i propri processi. Se un errore si verifica per colpa di un processo, è scontato che si riproporrà nel futuro».

Data la congiuntura, si faranno investimenti per la qualità del dato?

«Dobbiamo farli, siamo nell’Information age, andiamo verso la proattività».

Come si concilia la data quality con le reti sociali?

«Oggi si può misurare anche l’adeguatezza del dato, vagliandone la sorgente. Con algoritmi appositi si possono valutare contenuti, azioni e soggetti».

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome