I big data rappresentano una formidabile forza motrice per innumerevoli organizzazioni. Quali sono i dati di maggior valore? Senza dubbio quelli inerenti alle persone fisiche.
Si tratta di un bacino di informazioni preziose, quasi indispensabili per lo sviluppo di strategie di business efficaci, soprattutto nell’economia post-Covid.
Tuttavia, proprio per il loro grande valore e legame con l’individuo, i big data si prestano a riflessioni profonde e per molti versi indispensabili. Sono tre i punti fondamentali che abbiamo voluto evidenziare.
La trasposizione digitale di un individuo richiede che venga garantita la sua “integrità digitale”. Si tratta di una forma di rispetto morale; inoltre è innegabile che vi siano anche potenziali risvolti legali anche alla luce del GDPR.
La qualità dei dati è un altro punto fermo in una big data strategy. È evidente che un database scarsamente affidabile risulti quasi privo di valore. Certamente nessuna società baserebbe le proprie strategie su dati inaffidabili.
Il terzo pilastro, senza il quale nulla sarebbe possibile, è la sicurezza del dato.
Una sicurezza che va intesa nella sua accezione più ampia. Le organizzazioni devono garantire il rispetto delle normative vigenti, prima di tutto. Inoltre, i data breach sono in costante aumento: la cybersecurity è chiaramente parte della sicurezza. Infine, i dati vanno tutelati anche con adeguate policy di backup e strategie di ridondanza. Un fattore da non sottovalutare per tutti i data center e per le aziende che ne fanno uso.
Qual è la posizione di Ibm su questi tre pilastri dei big data? Ne abbiamo parlato con Giovanni Boccia, Data & AI, Technical Sales Leader Ibm Technology Italy.
Secondo Boccia, la crescita dei dati negli ultimi cinque anni è stata sbalorditiva. Tuttavia, è una minima parte di quelli che sono i volumi e la varietà di dati previsti solo per i prossimi cinque anni.
Le aziende hanno la necessità di utilizzare tecniche di advanced analytics per ottenere nuovi insight da sorgenti dati precedentemente mai sfruttate.
Allo stesso tempo, tutti questi big data comportano rischi crescenti per qualsiasi organizzazione. Il loro volume e velocità di arrivo precludono la revisione umana della maggior parte dei contenuti. La varietà dei dati apre la possibilità di trovare correlazioni che possono essere utilizzate per scopi dannosi. Ad esempio il furto criminale su larga scala di PII che espone le aziende a rischi di tipo etico, morale e anche legislativo. Inoltre le fonti dei big data sono spesso al di fuori del controllo dell’organizzazione; spesso sono così complesse da sollevare dubbi sulla veridicità delle informazioni o sulla qualità complessiva delle informazioni.
Le aziende hanno l’obbligo “morale” oltre che legislativo (esempio GDPR), di tutelare il proprio patrimonio informativo ed in particolare le informazioni personali che trattano, mettendo in atto delle strategie affinchè siano adeguatamente soddisfatte le aspettative degli utenti e che sia garantita loro la tutela della privacy.
Un altro aspetto fondamentale inerente alla tematica Big Data è quello della qualità; la capacità di eseguire una corretta analisi in grado di raggiungere risultati in linea con gli obiettivi, dipende fortemente dalla qualità dei dati utilizzati. Spesso i Big Data che vengono alimentati sia da sistemi gestionali e transazionali interni alle aziende ma anche da sorgenti esterne, che non possiedono le caratteristiche qualitative, quali Validità, Accuratezza, Coerenza, Integrità, Tempestività e Completezza, che li rendano affidabili.
La governance delle informazioni è il collante che guida l’estrazione di valore dalle informazioni garantendo la qualità e mitigando il rischio.
Le aziende si devono quindi dotare di una politica di governance delle informazioni che contribuisca a promuovere la sicurezza e la conformità. Questo per due ordini di motivi. Il primo è per favorire la gestione delle PII, supportando nella riduzione dei rischi di violazioni e sanzioni e proteggendo la fiducia dei clienti. Il secondo è per aumentare la confidenza sui dati grazie a metodologie di monitoring e di data cleansing. Ciò consente di prendere decisioni più accurate ed efficaci.
La governance dei dati pone le basi per dei dati pronti per il business attraverso il rispetto di regole e processi definiti per accelerare l’advanced analytic e le iniziative di business ad essa legate.
L’evoluzione della tecnologia digitale verso i big data richiede un’evoluzione anche delle tecnologie e soluzioni di cybersecurity per garantire la sicurezza del proprio patrimonio informativo.
Data security e governance, la strategia di Ibm
L’obiettivo principale della data security è proteggere il dato da accessi non autorizzati. Protezione che deve essere garantita indipendentemente dalla tipologia di repository o dal suo modello di deployment.
La data security non è solo proteggere la confidenzialità del dato; ma anche proteggerlo dal fatto che venga in qualche modo corrotto andando a minare la sua integrità o disponibilità.
Ibm ha un’esperienza decennale in ambito di metodologie e tecnologie a supporto dei processi di Data governance. Proprio in considerazione dei rischi connessi a una non corretta gestione dei dati personali, Ibm ha dato vita all’Open Data Governance Consortium per Apache Atlas. Si tratta di una delle principali strutture open source per l’elaborazione e lo storage dei dati distribuiti.
Frutto di questa decennale esperienza è una moderna piattaforma unica sul mercato, progettata per il multi cloud. La piattaforma di Ibm consente la gestione del processo di valorizzazione del patrimonio informativo end-to-end anche in ambienti complessi come quello Big Data.
Cloud Pak for Data offre un’esperienza unica nel suo genere, con servizi modulari che garantiscono dati affidabili e governati per ogni iniziativa di estrazione di valore dal patrimonio informativo, fornendo una tecnologia leader del settore che mette a disposizione servizi per l’accesso e l’integrazione dei dati, consente la governance delle informazioni (compresa l’identificazione e classificazione automatica dei dati di identificazione personale – PII – e loro opportuno mascheramento), il controllo della qualità, e soluzioni per una moderna analisi dei Big Data basata su Intelligenza artificiale e Machine Learning; il tutto fornendo un accesso ai dati in modalità self-service alle persone giuste al momento giusto, decentralizzazione l’ownership dei dati e delle relative architetture verso le diverse unità di business, secondo il nuovo approccio Data Fabric, nel pieno rispetto delle normative e della privacy.
Anche in merito alla cybersecurity, prosegue il manager, Ibm ha investito molto nell’ampliamento e nell’evoluzione tecnologica delle soluzioni di data security. Un esempio è l’applicazione dell’intelligenza artificiale nell’anomaly detection delle soluzioni di data protection, un algoritmo evoluto di machine learning consente di facilitare la scoperta e l’analisi degli attacchi informatici, permette di prevenire potenziali minacce e di conseguenza proteggere con maggior efficenza i dati.
Ibm Guardium poi consente alle organizzazioni di adottare un approccio efficace ed adattivo per proteggere i dati ovunque essi risiedano, offrendo funzionalità avanzate di data activity monitoring, anomaly detection, data compliance/auditing e data encryption per qualsiasi tipo di repository. Il modulo Ibm Guardium Insight, inoltre, permette di svolgere analisi avanzate per identificare, analizzare e valutare i rischi.