I big data rappresentano una formidabile forza motrice per innumerevoli organizzazioni. Quali sono i dati di maggior valore? Senza dubbio quelli inerenti alle persone fisiche.
Si tratta di un bacino di informazioni preziose, quasi indispensabili per lo sviluppo di strategie di business efficaci, soprattutto nell’economia post-Covid.
Tuttavia, proprio per il loro grande valore e legame con l’individuo, i big data si prestano a riflessioni profonde e per molti versi indispensabili. Sono tre i punti fondamentali che abbiamo voluto evidenziare.
La trasposizione digitale di un individuo richiede che venga garantita la sua “integrità digitale”. Si tratta di una forma di rispetto morale; inoltre è innegabile che vi siano anche potenziali risvolti legali anche alla luce del GDPR.
La qualità dei dati è un altro punto fermo in una big data strategy. È evidente che un database scarsamente affidabile risulti quasi privo di valore. Certamente nessuna società baserebbe le proprie strategie su dati inaffidabili.
Il terzo pilastro, senza il quale nulla sarebbe possibile, è la sicurezza del dato.
Una sicurezza che va intesa nella sua accezione più ampia. Le organizzazioni devono garantire il rispetto delle normative vigenti, prima di tutto. Inoltre, i data breach sono in costante aumento: la cybersecurity è chiaramente parte della sicurezza. Infine, i dati vanno tutelati anche con adeguate policy di backup e strategie di ridondanza: un fattore da non sottovalutare per tutti i data center e per le aziende che ne fanno uso.
Su questi temi, di fondamentale importanza per le moderne organizzazioni, abbiamo chiesto l’autorevole opinione di Fabio Pascali, Regional Director Italy di Cloudera
Secondo Pascali, Cloudera affronta tutti questi temi, partendo dal concetto di “Privacy by design”, ovvero un framework definito da Ann Cavoukian che propone di inserire proattivamente i requisiti per la privacy dentro le specifiche di un’architettura IT e nelle sue applicazioni. Le aziende, per aderire a questo modello, devono definire come effettivamente adottare i principi elencati in questo framework, definire quali dati debbano essere gestiti in conformità alle normative vigenti, dove vengono salvati, come vengono acceduti, da chi, quando, con quali livelli di permessi, come eventualmente cancellarli e come renderli mascherati.
La sfida consiste quindi nel mettere a disposizione dei team del marketing e delle altre divisioni di business la massima ricchezza di dati, per estrarne il massimo del valore, ma nell’assoluto rispetto delle normative.
Per fare questo è importante che i dati possano essere messi in un unico data lake, governato da politiche di Privacy by design.
Cloudera propone una Data Platform, la Cloudera Data Platform, caratterizzata sin dalla sua concezione dal modello di “Privacy by design”. Concretamente, Cloudera aiuta i clienti a raccogliere, trasformare, modificare, arricchire, consultare e mettere a disposizione di applicazioni di ML/AI tutti i dati, indipendentemente dalla loro natura. Supporta le aziende nell’assicurare la protezione dei dati mediante token o encryption, per ridurre i rischi legati a possibili data breach, che rappresentano un pericolo ancora maggiore quando si parla di informazioni personali.
A tal proposito, Cloudera fornisce uno strato di sicurezza, chiamato SDX, embedded nella piattaforma e in grado di gestire la sicurezza, gli accessi, i privilegi, gli audit ecc. In questo modo l’azienda può in ogni momento avere visibilità su chi accede a quali dati, per quale ragione e quali azioni vengono compiute sui dati stessi. Infine, poiché’ il dato è in movimento e in trasformazione, Cloudera fornisce tutti gli strumenti per seguirne il percorso, dalla fase di raccolta alla fase di distribuzione, sulle varie applicazioni, tracciandone le modifiche e i movimenti. Pertanto, anche in un contesto di trasformazioni ed elaborazioni per consentire l’estrazione di valore dai dati, inclusi quelli personali, Cloudera fornisce gli strumenti per mantenere sempre la compliance.
In questo modo, Cloudera supporta a pieno titolo i tre pilastri: Cloudera Data Platform è in grado di fornire supporto alla protezione e alla integrità del dato, ma al tempo stesso fornisce un valido supporto alla qualità del dato stesso.
Come realtà leader di settore, Cloudera gioca un ruolo di primo piano nell’accompagnare innumerevoli organizzazioni nel percorso verso l’utilizzo dei big data. Con quali strumenti e soluzioni tecnologiche supportate le organizzazioni?
Cloudera si occupa di gestire l’intero ciclo di vita del dato, dal punto di generazione del dato stesso, alla sua elaborazione e trasformazione anche in real-time, al reporting, alla gestione di ambienti transazionali, alla elaborazione con algoritmi di ML e AI sugli stessi dati. L’obiettivo è quello di avere un’unica piattaforma per i dati, ovunque essi siano, on premise o nel cloud, e di qualunque natura siano, per andare quindi al di là dei semplici big data. In questo modo, i clienti possono gestire il patrimonio dati in maniera unificata, ottimizzando i costi ed evitando duplicazioni per dare servizio a diverse applicazioni. Inoltre, possono mettere a disposizione dei team di Data Science, Data Engineering o dei processi di machine learning e intelligenza artificiale il più ampio set di dati possibile, per poter definire data set diversi per le proprie esigenze specifiche, senza creare cluster di dati duplicati. Possono anche elaborare insights partendo dal più ricco set di informazioni a disposizione.
Pertanto, l’aspetto del Data Management è al centro della Cloudera Data Platform, che quindi è in grado di gestire i dati e il loro percorso attraverso tutte le possibili applicazioni e indipendentemente da dove si trovano, on premise o nel public cloud, creando le basi per una architettura realmente ibrida e indipendente dal Cloud Provider.
Un altro aspetto fondamentale è quello della sicurezza e del controllo dei dati. Cloudera ha creato un layer di governance e sicurezza, denominato SDX, indipendente dai livelli di compute e storage, e in grado di agire in maniera integrata ovunque siano i dati, on premise o in cloud.
Inoltre, nell’ottica di aiutare i clienti a raggiungere prima possibile i risultati di business attesi, Cloudera mette a disposizione dei Data Services, che poggiano sulla Cloudera Data Platform comune ed erogano servizi di Data Engineering, Data Warehouse e Machine Learning. In questo modo, i clienti possono gestire un provisioning semplificato degli ambienti per partire su nuovi use case con una velocità fino a 10 volte superiore, ottimizzando le risorse, abbassando i costi infrastrutturali fino al 50% e mettendo a disposizione performance prevedibili, grazie alla gestione multi-tenancy e alla separazione logica dei workload.