Cloudera oggi si fa chiamare “the modern platform for machine learning and advanced analytics“, ma non è un vezzo: il motivo è che servono più che mai competenze interne alle aziende sui big data e non essendocene bisogna aiutarsi con strumenti automatizzati che lavorino sui dati in modo rapido.
Che detto in altro modo significa che stanti i big data bisogna superare i limiti intrinseci dei datawarehouse, specie quando questi vengono usati ancora per fare operazioni di ETL (Extract, Transform and Load). Vanno modernizzati, e con essi tutta l’azienda.
Cloudera propone una piattaforma unificata per i big data, un hub di dati aziendale basato su Apache Hadoop. In tal modo propone alle aziende uno spazio per archiviare, consultare, elaborare, proteggere e analizzare tutti i dati, consentendo di estendere il valore degli investimenti esistenti. La piattaforma per i big data di Cloudera è opensource. Con un ruolo fondamentale nella formazione di professionisti Hadoop, Cloudera ha formato oltre 40.000 persone in tutto il mondo. Ha oltre 1.800 partner al mondo.
Come fa Navistar, che utilizza la piattaforma OnCommand di Cloudera per fare manutenzione predittiva della flotta di autoarticolati. Con l’utilizzo di geolocalizzazione e telematica su 300mila veicoli ha ridotto il costo di gestione da 12 dollari per miglio a 0,3 dollari per miglio.
Oppure come fa l’italiana OptoTelematics, (il Cio è Gianfranco Giannella), per gestire i black box montati sulle autovetture a fini assicurativi e capire il comportamento degli utenti. Gestiscono 5 milioni di autoveicoli contemporaneamente: hanno bisogno di soluzioni automatizzate.
L’italiano Michele Guglielmo si occupa della South Region europea da gennaio 2016. Lo scopo di Cloudera è migliorare la qualità di vita delle aziende e delle persone, con l’uso intelligente dei big data (l’azienda partecipa eticamente anche alla ricerca sul genoma).
All’inizio in Italia Cloudera era fatta da tre persone, ora sono in dodici. «Ma ci aspettiamo di essere di più l’anno prossimo. Due persone lavorano sul canale. Abbiamo varato un partner program con training per la certificazione. Perché utilizzare una piattaforma Cloudera non è una cosa semplice». Una decina attualmente sono i partner selezionati.
Fra i clienti di Cloudera ci sono le tre grandi tlc italiane, cosè come le principali banche, come Unicredit.
Alcuni pagano le sottoscrizioni, altri usano solamente la piattforma di big data in opensource.
«I risultati ci stanno dando ragione – dice Guglielmo – Italia e Spagna guidano la crescita».
Semplificare i carichi di lavoro dei big data nel cloud
Esemplare per l’attività di Cloudera è Altus, un’offerta Platform-as-a-Service (PaaS) che semplifica l’esecuzione di applicazioni di elaborazione dati su larga scala nel cloud pubblico.
Il servizio Altus iniziale aiuta i data engineer a utilizzare l’infrastruttura on-demand per velocizzare la creazione e l’utiilizzo di pipeline di dati flessibili che alimentano sofisticate applicazioni orientate ai dati.
Applicazioni di data engineering come ETL o batch scoring spesso corrispondono a carichi di lavoro di grandi dimensioni batch-oriented che operano per un periodo di tempo fissato e aiutano le aziende a estrarre informazioni approfondite fondamentali dai dati grezzi.
Le aziende ottengono così significativi vantaggi in termini di flessibilità ed efficienza eseguendo tali pipeline su un’infrastruttura elastica. Le grandi aziende desiderano sfruttare l’infrastruttura cloud insieme a strumenti e tecnologie di elaborazione dati di uso comune su vasta scala.
Il servizio Cloudera Altus Data Engineering punta a semplificare lo sviluppo e l’esecuzione di pipeline di dati centralizzando le attività di data engineering e astraendo la gestione dell’infrastruttura e le operazioni che possono essere complesse e dispendiose in termini di tempo.
Inoltre, Altus riduce il rischio associato alle migrazioni cloud fornendo agli utenti strumenti di uso comune in un servizio di piattaforma enterprise aperto e unificato che offre storage, metadati, sicurezza e gestione comuni per molteplici applicazioni di data engineering.