La maggior parte delle grandi aziende sta sviluppando un approccio multicloud nella sua migrazione verso la “nuvola”. I principali cloud provider offrono tutti una ampia gamma di servizi ma hanno ciascuno una qualche sua specializzazione, il che spinge le imprese a scegliere fornitori diversi per servizi differenti.
È una scelta eterogenea che viene fatta anche per avere una maggiore elasticità, evitare di essere legati troppo strettamente a un solo provider e, non ultimo, per cercare di ridurre i costi.
È però una scelta che introduce complessità nella gestione dei dati. Il passaggio al cloud per molte aziende è anche la spinta giusta per abbandonare la divisione delle informazioni in sistemi on-premise che non comunicano, sarebbe paradossale trovarsi ad avere la stessa separazione nel cloud.
Uno dei temi caldi del momento è quindi far dialogare in maniera sicura e organizzata data lake che sono su infrastrutture diverse ed è su questo che si sono incentrate le novità della Talend Data Fabric per l’edizione Summer 17 rilasciata in questi giorni.
Il primo elemento chiave per la nuova versione della Talend Data Fabric è quindi la presenza di più connettori per dialogare non solo con AWS, come in precedenza, ma anche con Microsoft Azure, la Google Cloud Platform, Cloudera Altus e Snowflake.
Quest’ultima è una piattaforma di data warehousing in cloud che non è magari molto nota in Italia ma che sta velocemente prendendo piede a livello globale, per le sue caratteristiche di velocità nella gestione dei flussi di dati.
Più in dettaglio, la Talend Data Fabric ora è in grado di interfacciarsi con le implementazioni Hadoop di Azure (HDInsight) e della GCP (Dataproc). Talend è anche la prima piattaforma a supportare Cloudera Altus per la creazione “as a service” di cluster Hadoop su AWS.
L’integrazione è a livello direttamente di Talend Studio ed è quindi interessante anche in ottica di sviluppo veloce: si definisce una pipeline di integrazione dati in ambiente Talend e questa viene “tradotta” da Altus in un cluster Hadoop che resta attivo solo per il tempo necessario.
Altri due punti su cui la Talend Data Fabric è stata migliorata riguardano le procedure per il controllo della qualità dei dati e la portabilità del codice nativo generato. Nel primo ambito la novità è l’introduzione in Talend Data Stewardship di algoritmi di machine learning alimentati da Apache Spark per la bonifica dei dati. Nuova anche la parte per l’estrazione e la gestione dei metadati dei Big Data: aiuta tra l’altro a capire dove sono i dati, come sono fatti, chi è coinvolto nella loro produzione e chi vi accede.
La Talend Data Fabric poi cerca di essere il più possibile “agnostica” rispetto alle piattaforme sottostanti, intese sia come ambienti cloud sia come tecnologie. La definizione dei flussi di integrazione è astratta, solo il codice nativo generato è specifico in base alla piattaforma. Basta quindi cambiare le impostazioni di generazione per avere le proprie pipeline dei dati adattate a tecnologie o ambienti diversi.
Quest’ultimo è un elemento considerato essenziale perché oggi, contrariamente a quanto accadeva in passato, la frequenza di evoluzione e anche sostituzione della parte di gestione dei dati può essere molto elevata. È la parte di integrazione che invece finisce per restare costante, o perlomeno lo resta più a lungo, e per essere compatibile con le novità deve essere aperta e trasversale.
Segnali di crescita
Se le novità tecnologiche di Talend seguono la scia dell’ampliamento funzionale e dell’adeguamento alle esigenze di integrazione dei clienti, anche lo sviluppo della società conferma quello che si era già visto nei mesi precedenti. La crescita in fatturato prosegue con il trend del 40-50 percento l’anno puntando soprattutto sui grandi clienti a livello globale ed è organica, perché la software house non fa particolari acquisizioni.
I risultati della filiale italiana sono in linea con quelli globali e il parco clienti si attesta al momento sulla trentina. Si tratta di realtà soprattutto in ambito retail e finanziario (e collaterali, Generali ad esempio è una delle principali referenze), sono partiti i primi progetti anche nel settore delle utility. L’obiettivo è ampliare il numero dei grandi clienti sfruttando le competenze e l’esperienza sviluppate a livello globale.
Parallelamente va sviluppato il canale locale dei system integrator e dei VAR, per avere una copertura più capillare del mercato italiano. Un mercato che dovrebbe essere molto interessante anche se ancora latente: a dimostrare l’interesse locale per la Talend Data Fabric è il fatto che l’Italia è costantemente tra le prime tre nazioni per numero di download della versione community gratuita. Serve quindi un canale pronto a seguire chi sta sperimentando e può decidere di passare alle versioni commerciali o di cominciare a sperimentare con il mondo cloud.