Home Big Data Big data, da Aws un approccio completo per le organizzazioni

Big data, da Aws un approccio completo per le organizzazioni

.I big data rappresentano una formidabile forza motrice per innumerevoli organizzazioni. Quali sono i dati di maggior valore? Senza dubbio quelli inerenti alle persone fisiche.
Si tratta di un bacino di informazioni preziose, quasi indispensabili per lo sviluppo di strategie di business efficaci, soprattutto nell’economia post-Covid.

Tuttavia, proprio per il loro grande valore e legame con l’individuo, i big data si prestano a riflessioni profonde e per molti versi indispensabili. Sono tre i punti fondamentali che abbiamo voluto evidenziare.

La trasposizione digitale di un individuo richiede che venga garantita la sua “integrità digitale”.  Si tratta di una forma di rispetto morale; inoltre è innegabile che vi siano anche potenziali risvolti legali anche alla luce del GDPR.

La qualità dei dati è un altro punto fermo in una big data strategy. È evidente che un database scarsamente affidabile risulti quasi privo di valore. Certamente nessuna società baserebbe le proprie strategie su dati inaffidabili.

Il terzo pilastro, senza il quale nulla sarebbe possibile, è la sicurezza del dato.

Una sicurezza che va intesa nella sua accezione più ampia. Le organizzazioni devono garantire il rispetto delle normative vigenti, prima di tutto. Inoltre, i data breach sono in costante aumento: la cybersecurity è chiaramente parte della sicurezza. Infine, i dati vanno tutelati anche con adeguate policy di backup e strategie di ridondanza: un fattore da non sottovalutare per tutti i data center e per le aziende che ne fanno uso.

Abbiamo raccolto l’opinione più che autorevole di Antonio d’Ortenzio – Senior Manager Solutions Architecture, Aws.

L’importanza dei big data è oggetto di discussione da più di una decade ormai; più recentemente è stata messa in evidenza la possibilità di fare leva sulla centralità del dato per guidare le scelte strategiche di business. Si è iniziato così a parlare di *data-driven enterprises*.  E di come le aziende con un’impostazione tradizionale della gestione del dato dovrebbero intraprendere percorsi di trasformazione verso un modello data-driven. Grazie al potenziamento che i big data hanno ottenuto attraverso applicazioni basate su Machine Learning, Artificial Intelligence e Advanced Analytics, è ora più immediato per le aziende arrivare a scoprire nuove opportunità che spesso portano a nuovi prodotti e nuovi mercati. I dati sono ormai a tutti gli effetti un asset aziendale che influenza due aree principali: il miglioramento delle interazioni con i clienti e l’aumento dell’efficienza. I dati sono la base per obiettivi quali, ad esempio, la personalizzazione, il pricing dinamico, l’espansione di mercato, l’innovazione di prodotto, l’ottimizzazione della supply chain.

Il tema dell’*integrità digitale* è sicuramente di rilievo nella gestione dei big data, in particolar modo dei big data gestiti in cloud. Questa è una top priority per Aws: la società vigila costantemente sulla privacy dei dati dei nostri clienti. I clienti Aws hanno il pieno controllo sui loro contenuti e su dove essi risiedono. Con l’apertura dei data center della nostra infrastruttura cloud italiana (la Regione Aws Europe (Milano)) ad aprile dello scorso anno, i clienti continuano a mantenere la completa proprietà dei propri dati e sanno che questi non verranno spostati dal suolo italiano a meno che non scelgano loro stessi di farlo. E per assicurarsi della piena privacy del dato, i nostri clienti possono crittografarlo, sia in transito che “at rest”, tramite chiavi sotto il loro pieno controllo. Aws fa inoltre parte di numerose associazioni focalizzate sulla protezione della privacy e della sicurezza e ha ottenuto una serie di certificazioni e accreditamenti riconosciuti a livello internazionale che dimostrano la conformità con gli assurance framework di terze parti.

Sul tema GDPR, già nel Marzo 2018 abbiamo annunciato che tutti i servizi e le features Aws sono conformi al GDPR. Questo vuol dire che i clienti possono utilizzare i servizi Aws come elemento chiave dei loro piani di GDPR-compliance. E questo riguarda anche e soprattutto i servizi e le features che vengono utilizzati in ambiti big data.  I clienti Aws possono utilizzare tutti i servizi per elaborare i dati personali (come definiti nel GDPR) caricati nei servizi AWS nei loro account in conformità con il GDPR. Di fatto, i clienti Aws possono stabilire dove archiviare i dati, selezionando anche il tipo di archiviazione e la sua Regione geografica. È inoltre possibile selezionare il livello di sicurezza dei dati, attraverso ad esempio una solida crittografia sia in transito sia “at rest”, come anche gestire l’accesso ai dati, servizi e risorse di Aws mediante utenti, gruppi, autorizzazioni e credenziali sotto il controllo dei clienti.

Il pilastro relativo alla *qualità del dato* è altrettanto importante. Ed è un tema apparentemente contrapposto all’altra necessità emergente che è il vero abilitatore del modello data-driven enterprise: l’*agilità del dato*. Nel mondo digitale di oggi, pieno di rapidi cambiamenti, incertezze e complessità abbiamo bisogno di un dato agile e allo stesso tempo di un dato di qualità per rispondere in modo rapido e flessibile alle circostanze più mutevoli.

Il valore è creato non solo dai dati in sé, ma anche e soprattutto dai tool e dai processi di cui disponiamo per analizzarli e per produrre risultati di business. I dipendenti aziendali devono disporre di strumenti facilmente disponibili per lavorare con i dati e delle competenze per farlo. AWS mette a disposizione dei suoi clienti strumenti ma soprattutto approcci che puntano a unire gli aspetti di qualità e di agilità, che è un passaggio chiave nel processo di trasformazione verso la data-driven enterprise. Pensiamo per esempio al cambiamento del dato che da puramente transazionale deve acquisire agilità e allo stesso tempo mantenere qualità: abbiamo per anni gestito dati rinchiusi in database altamente strutturati a protezione della transazionalità, con strumenti come i database relazionali. Questi stessi aspetti di affidabilità possono ora essere ottenuti attraverso l’implementazione corretta di un data lake su Aws , aggiungendo allo stesso tempo quelle caratteristiche di agilità necessarie al cambiamento.

E parlando di approcci di questo tipo, è immediato il collegamento con il terzo pilastro, quello sulla *sicurezza*. Se pensiamo infatti agli sforzi con i quali abbiamo posto attenzione alla privacy finora, ci accorgiamo di aver tendenzialmente posto un limite all’agilità anziché abilitarla. Abbiamo cioè per lo più applicato limiti stringenti all’accesso al dato anziché cercare modi di rendere il dato disponibile all’interno di guard-rails di privacy. Aws fornisce molti tool per automatizzare il controllo degli accessi e permette di farlo ad un livello tale di granularità da dare a ciascun dipendente l’accesso preciso al dato che deve poter vedere. Ci sono molti modi per tracciare la provenienza e la validità del dato, per crittografarlo, oscurarlo o restringere l’accesso a livello di record o di singolo campo. Oppure si può scegliere di gestire dati a livello aggregato o con informazioni mascherate o rese anonime. La flessibilità sta proprio in questo: ogni data-driven enterprise deve poter prendere decisioni responsabili riguardo privacy e security sulla base del tipo di dato da esse amministrato.

Antonio D'Ortenzio
Antonio D’Ortenzio

Come realtà leader di settore, Aws gioca un ruolo di primo piano nell’accompagnare innumerevoli organizzazioni nel percorso verso l’utilizzo dei big data. Con quali strumenti e soluzioni tecnologiche supportate le organizzazioni?

I business che stanno affrontando la trasformazione verso il modello data-driven sono nel mezzo di un cambiamento per larga parte culturale, prima ancora che di reali capabilities. Aws aiuta questi clienti mediante l’assistenza fornita dai suoi Account Teams. I quali dispongono di esperienza e conoscenze che contribuiscono a rimuovere blockers sia di natura cultural che in tema di capabilities.

L’adozione di una strategia data-driven passa per fasi ben delineate, ognuna sostenuta da strumenti e tecnologie AWS volte a supportare i clienti verso il raggiungimento dell’obiettivo.

La fase iniziale ha l’obiettivo di consentire ai clienti di raccogliere anche più dei dati di cui essi hanno bisogno; questo perché i dati hanno un potenziale che non sempre è noto al momento della loro acquisizione. Lo storage in cloud ha un costo basso e progressivamente decrescente, quindi gli strumenti di acquisizione devono offrire caratteristiche che permettano di catturare la quantità maggiore possibile di dati dal campo. In questa fase, ad esempio, tutta la suite di servizi Aws in ambito IoT fornisce strumenti di acquisizione aperta, scalabile e sicura da sensoristica distribuita sul campo.

La fase di storage del dato è invece il più possibile guidata dal cosiddetto “approccio lake house”. Esso mira a implementare un approccio indifferenziato all’analisi dei dati. Non si tratta solo di integrare un data lake con un data warehouse, ma piuttosto di integrare un data lake, un data warehouse e degli archivi dedicati, assicurando una governance unificata e semplicità nel trasferimento dati. L’architettura lake house su Aws permette ai clienti di archiviare i dati in un data lake e utilizzare un insieme di servizi dedicati al data lake, permettendo di prendere decisioni in modo rapido, agile, su larga scala e con un rapporto prezzo/prestazioni senza paragoni sul mercato.

La realizzazione del data lake su AWS è basata sullo storage offerto dal servizio Amazon Simple Storage Service (S3); esso è è il servizio di storage ad oggetti popolare per le sue performance e per la capacità di ospitare dati strutturati e non strutturati. Ciò lo rende ideale per creare un data lake. Con Amazon S3 si può creare e scalare in modo conveniente un data lake di qualsiasi dimensione in un ambiente sicuro. In cui i dati sono protetti con una durabilità del 99,999999999% (11 nove).

Il dato così memorizzato e gestito può essere quindi reso disponibile attraverso un insieme completo di strumenti Aws. Tool che vanno al di là della funzionalità di sicurezza standard come la crittografia e il controllo di accesso; essi in realtà arrivano al monitoraggio proattivo e alla gestione unificata delle policy di sicurezza. I clienti possono definire e gestire centralmente le policy di sicurezza, governance e verifica per soddisfare le normative specifiche del settore e dell’area geografica.

E’ possibile guidare la creazione di un data lake su Aws mediante il servizio Aws Lake Formation. Creare un data lake con AWS Lake Formation è semplice quanto definire le data source. Insieme a quali policy di accesso ai dati e di sicurezza si vogliono applicare.

Aws Lake Formation consente di raccogliere e catalogare i dati dai database e da storage a oggetti. Permette anche di spostare i dati nel nuovo data lake definito su Amazon S3. Oltre a pulire e classificare i dati utilizzando algoritmi di machine learning e proteggere l’accesso ai dati sensibili. Gli utenti possono accedere a un catalogo centralizzato di dati che descrive i set di dati disponibili e il loro utilizzo appropriato. Gli utenti possono quindi sfruttare questi set di dati. Scegliendo fra servizi di analisi e di machine learning, come Amazon Redshift, Amazon Athena e Amazon EMR per Apache Spark. Aws Lake Formation fa leva sulle funzionalità disponibili in Aws Glue.

Questa ampia gamma di possibilità permette di definire la fase analitica nel rispetto del modello data-driven enterprise. L’analisi ora è caratterizzata da approcci di Machine Learning e Predictive analytics. E non più soltanto da Batch reporting, Business Intelligence e visualizzazioni. Ciò avveniva nell’epoca del Data Warehouse, ovvero prima che questa fondamentale trasformazione dell’approccio al dato avesse inizio.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche
css.php