Il Data and AI Leadership Executive Survey 2022, punto di riferimento per monitorare l’implementazione di Big Data e IA nelle aziende Fortune 1000 – sottolinea Databricks –, conferma che il numero di organizzazioni in cui prevale una cultura “orientata ai dati” non è in crescita e che, sebbene nell’ultimo decennio siano stati compiuti molti progressi – tra cui un aumento del 73,7% nelle nomine di Chief Data and Analytics Officer (+61,7% rispetto al 2012) – il percorso per diventare sempre più data-driven è ancora molto lungo.
Infatti, solo il 26,5% dichiara di aver raggiunto questo obiettivo con il 19,3% che invece ha consolidato una vera e propria “data culture” aziendale.
Questi dati confermano – mette sempre in evidenza Databricks – che, sebbene alcune aziende siano riuscite a coglierne il reale valore e le potenzialità, molte altre non sono ancora in grado di liberarsi da sistemi compartimentali in “silos” perché non dispongono di un modello di data governance unico e unificato che consenta di utilizzare i dati in modo strategico e trasformativo.
Il problema secondo Databricks risiede nella struttura stessa di un’azienda, che spesso non nasce già munita di una strategia dati, ma vede crescere le capacità di gestione dei dati in diverse aree di business in modo naturale.
Attualmente le aziende comprendono che, al fine di ottenere un vantaggio competitivo sfruttando le potenzialità dei dati, è necessario disporre di una strategia dati coerente che coinvolga più unità di business (se non tutte).
Il rischio è che, poiché le potenzialità fornite dai dati in ciascuna divisione crescono in modo organico, esse utilizzino tecnologie, modelli di governance e protocolli di accesso diversi – e talvolta incompatibili tra loro – rendendo così impossibile il flusso dei dati e la conseguente realizzazione di risultati e benefici per il business.
Con la progressiva crescita ed espansione delle aziende, la complessa rete di sistemi di dati nelle diverse divisioni di business si moltiplica, ostacolando ancora una volta il flusso dei dati tra le fasi di elaborazione degli stessi. Le aziende che si trovano in questa situazione non saranno mai in grado di valorizzare al meglio i propri dati, poiché la mancanza di un sistema di data governance uniforme non consente ai data team di lavorare in modo collaborativo e sinergico.
Arduino Cascella, Solutions Architect Manager presso Databricks, descrive i tre pilastri tecnologici fondamentali su cui le aziende dovrebbero concentrarsi quando cercano di sviluppare una strategia dati di successo:
- Utilizzare un’architettura dati moderna: storicamente, la business intelligence prevedeva i data warehouse, diversamente da data science e machine learning che necessitavano di data lake. Un data warehouse è un repository che raccoglie dati strutturati e “filtrati”, mentre un data lake è indispensabile per grandi quantità di dati non strutturati. Le aziende dovrebbero orientarsi verso un’architettura dei dati moderna e aperta, che consenta di fornire i dati a tutti gli utenti in tutti i casi d’uso e non richieda l’archiviazione di copie su differenti tecnologie. La semplificazione dell’architettura dati consentirà di abbattere le barriere tecnologiche e ai team di lavorare in modo sinergico, evitando di operare su soluzioni disconnesse per casi d’uso diversi. Una piattaforma aperta, integrata e moderna come il data lakehouse – una combinazione di data warehouse e data lake – offrirà maggiore collaborazione e innovazione tra tutti i data team.
- Progettare in cloud: considerato in passato come un semplice “nice to have”, oggi rappresenta una parte integrante di una gestione dei dati di successo. Dopo aver preso piede nei primi anni 2000, l’adozione del cloud è esplosa negli ultimi anni, fino a diventare il principale approccio per la creazione e la fruizione di una piattaforma dati moderna. Molti data team operano su cloud distinti, adottando un approccio multi-cloud. Ciò consente ai team di eseguire carichi di lavoro ovunque, integrare facilmente nuove soluzioni e garantire la propria conformità nel tempo.
- Il valore dell’open source: destinato a crescere parallelamente alla costante evoluzione delle architetture dati. La tecnologia open source e gli standard aperti dissuadono i team dallo sviluppare soluzioni interne eccessivamente complesse. Sono inoltre relativamente poco costosi e controllati da esperti, riducendo la probabilità di rischi operativi. Inoltre, può rappresentare una risorsa illimitata in termini di innovazione, consentendo ai data team di entrare in contatto con la più ampia comunità open source e di avere piena visibilità sul codice originale.
Arduino Cascella, Solutions Architect Manager di Databricks, ha dichiarato: “Una cultura dei dati è tale quando i dati sono posti al centro di ogni decisione strategica aziendale. Idealmente, dovrebbero essere di qualità elevata, gestiti centralmente e accessibili a tutti i team. L’utilizzo di intelligenza artificiale e machine learning consente di automatizzare le attività quotidiane sui dati, aumentando l’efficienza e risparmiando tempo che può essere invece dedicato a innovazione e risoluzione di problemi complessi.
L’introduzione di una piattaforma di dati aperta, collaborativa e unificata consente di spostare i dati da sistemi in silos – dislocati e spesso poco affidabili – e lavorare invece attingendo da una unica fonte dati che consente una collaborazione davvero efficace nelle organizzazioni”.
La costruzione di una cultura dei dati richiede una strategia che, se attuata con successo, può rivelarsi estremamente efficace.
Databricks fa l’esempio di un suo cliente prestigioso, che raccoglie informazioni dai propri dati attraverso una piattaforma intelligente: sfruttando l’intelligenza artificiale e la tecnologia del digital twin, Rolls Royce è riuscita a evitare che oltre 200 milioni di chilogrammi di carbonio finissero nell’atmosfera, migliorando drasticamente l’efficienza dei suoi motori.
Rolls Royce ha anche prolungato l’intervallo di tempo tra i controlli di manutenzione dei suoi motori, riducendo così il dispendio di denaro per interventi non necessari. È evidente che il pieno sfruttamento dei dati può rivoluzionare il modo in cui un’azienda opera.
La governance dei dati sembra essere l’aspetto più problematico di un’iniziativa di trasformazione dei dati. La responsabilità è spesso da attribuire al mantenimento di più architetture di dati in conflitto tra loro, che a causa di diversi livelli di sicurezza e approcci alla governance rendono i dati scarsamente affidabili e non aggiornati.
Per questo motivo – evidenzia Databricks –, le aziende dovrebbero ridurre al minimo il numero di copie dei dati, optando invece per un unico livello di elaborazione. In questo modo sarà possibile avere una visione globale di tutti i dati disponibili e quindi eseguire controlli di governance, mantenendo al contempo elevati livelli di conformità e qualità.
In assenza di una strategia data efficace, le organizzazioni si lasciano sfuggire migliaia di informazioni che rimangono inevitabilmente non sfruttate. Utilizzare una moderna architettura dati significa ispirare a una reale collaborazione e innovazione tra data team. Grazie alla centralizzazione dei dati e la scomparsa dei silos, la gestione delle analytics diventa molto più intuitiva ed efficiente.