Si dice spesso che le aziende devono essere data driven. Ma cosa significa concretamente, in pratica, nel quotidiano? Lo abbiamo chiesto a Amr Awadallah, Cto di Cloudera, società che fa una piattaforma per attività di machine learning e analytics ottimizzata per il cloud che trasforma dati complessi in insight precisi e fruibili.
Nel corso degli ultimi vent’anni i dati sono cresciuti in modo esponenziale, tanto che Idc stima che entro il 2025 arriveremo alla quantità di 163 zettabyte di dati
In questo contesto, secondo Awadallah, «diventare data driven significa essere realmente in grado di sfruttare ogni tipo di dato indipendentemente da dove risieda non solo per rendere più semplice il processo decisionale, ma anche per scoprire nuove opportunità di business altrimenti difficili, se non impossibili da trovare. Mentre la maggior parte delle aziende si è ora resa conto del valore di sfruttare i propri set di dati, lo sviluppo di una giusta strategia per ottenere risultati di business tangibili, nel rispetto di rigorosi standard normativi e di compliance, è salito in cima all’agenda aziendale. L’uso diffuso dei sensori IoT, la generazione di flussi di dati provenienti dai confini e l’industrializzazione della AI richiede uno stack tecnologico end-to-end supportato dalla potenza del cloud ibrido».
Come si coniugano i data set alle differenti applicazioni in ambito Iot, sanità e retail? Esistono piattaforme migliori di altre?
Per raggiungere i propri obiettivi di trasformazione digitale e diventare davvero data driven, le aziende hanno bisogno di più che non un migliore strumento di data warehouse, data science o BI. Con l’emergere di nuovi tipi di dati e la comparsa di nuovi casi d’uso, le aziende dovranno affidarsi a una serie di capacità analitiche – dal data engineering al data warehousing, fino ai database operativi e alla data science – disponibili all’interno di un’infrastruttura cloud estesa.
Il confine dell’infrastruttura è la fonte di dati più ricca e in più rapida crescita, con la gran parte di questi dati non strutturati e spesso non sfruttati. Tuttavia, rappresenta una grande quantità di informazioni relative a tutto, dai processi industriali, ai trasporti, all’uso dell’energia, alla sanità, all’intrattenimento e all’utilizzo dei media.
Ora che i dati sono diventati location-agnostic, le aziende hanno bisogno di affidarsi a una data platform in grado di sbloccare più velocemente le informazioni utili, indipendentemente dalla fonte, dal confine fino all’intelligenza artificiale.
Solo attraverso una piattaforma completa, le aziende saranno in grado di generare insight su larga scala mantenendo il controllo sui propri set di dati e sbloccare nuove opportunità di business. I progressi tecnologici nel machine learning stanno aprendo la strada a una nuova generazione di moderne applicazioni AI che possono portare migliori risultati di business e risolvere le sfide che il nostro mondo si trova ad affrontare.
Qual è il limite degli analytics odierni?
I tradizionali strumenti di analisi, che migliorano semplicemente la visibilità dei dati non sono più sufficienti per tenere il passo con la necessità di analizzare i dati in tempo reale. Essere data driven richiede la capacità di applicare differenti metodologie di analisi rispetto ai dati che si trovano ovunque.
Se prendiamo a esempio i veicoli autonomi e connessi, è necessario elaborare e trasmettere dati in tempo reale da più endpoint collocati alla periferia, stimando al contempo i risultati chiave e applicando un apprendimento automatico sugli stessi dati per ottenere informazioni complete che forniscono valore. Lo stesso vale, naturalmente, per le esigenze di data steward e data scientist, per valutare i dati in momenti diversi della catena di elaborazione.
Oggi, casi di utilizzo a maggior valore aggiunto, come machine learning and analytics, hanno portato in scena una varietà di requisiti completamente nuovi, che devono essere affrontati senza soluzione di continuità durante l’intero ciclo di vita dei dati per fornire un quadro coerente. Le imprese hanno bisogno di un nuovo approccio.
La crescita delle aziende ha portato con sé la necessità di una piattaforma completa sostenuta dalla potenza del cloud per gestire i casi d’uso più impegnativi e complessi. La migrazione di alcuni dei carichi di lavoro più impegnativi verso il cloud sarà di fatto la prossima grande priorità per le aziende, in modo che queste possano affrontare gli scenari più attuali e complessi, forti di misure di massima sicurezza.
In questo quadro cos’è un enterprise data cloud? A chi serve? Come si implementa? Come si gestisce?
Poiché le imprese in fase di trasformazione digitale richiedono un’esperienza analitica moderna in grado di coprire ambienti pubblici, privati, ibridi e multi-cloud, si aspettano di eseguire i loro workload ovunque desiderano, indipendentemente da dove risiedono i loro dati. Per offrire questa flessibilità, un enterprise data cloud può consentire alle aziende di ottenere informazioni chiare e utilizzabili partendo da dati complessi ovunque, sulla base di quattro pilastri fondamentali: la capacità di lavorare con ambienti ibridi e multi-cloud, di essere multi-funzionali, sicuri e gestiti, ma anche open.
Il nostro enterprise data cloud, che integra i migliori elementi delle piattaforme precedenti di Cloudera e Hortonworks, consente il controllo dei dati aziendali ovunque si trovino. Le analisi possono essere eseguite sul cloud preferito dal cliente, dati e metadati possono essere spostati tra i file system on-premise e gli archivi di oggetti cloud. La riservatezza dei dati e la conformità vengono affrontate con successo attraverso un modello di sicurezza comune, con criteri di accesso basati su ruoli e attributi. Infine, ma non meno importante, la piattaforma Cloudera è al 100% open: offriamo ai clienti libertà di scelta – open source, open compute, open storage, open architecture e open cloud – evitando così qualsiasi tipo di lock-in. Dal momento che siamo in grado di eseguire analisi senza soluzione di continuità dalla periferia all’intelligenza artificiale, stiamo risolvendo i casi d’uso aziendale più impegnativi in molti settori industriali differenti.