Google ha annunciato la disponibilità generale di Cloud Data Fusion, un servizio nativo del cloud e completamente gestito di data ingestion e integrazione dei dati che può offrire a qualsiasi team le capacità di un data engineer, indipendentemente dalle conoscenze di codice.
A quale esigenza intende rispondere questa soluzione? Creare un’integrazione di dati affidabile e flessibile è un passo essenziale per un’azienda, al fine di conseguire un processo di data analytics di successo. Tuttavia, secondo Google Cloud l’elaborazione tradizionale dei dati e i processi ETL (estrazione, trasformazione e caricamento dei dati) fatti in casa sono complessi e richiedono molto tempo, rallentando l’analisi dei dati.
L’obiettivo di Google Cloud è dunque quello di semplificare radicalmente i processi di integrazione e acquisizione dei dati, per accelerare i tempi che portano agli insight. Come? Con una soluzione che permette lo sviluppo senza codice delle pipeline ETL/ELT.
Data Fusion fornisce a sviluppatori, data engineer e business analyst la possibilità di creare e gestire in modo facile pipeline ETL/ELT per ripulire, trasformare e integrare i dati da un’ampia gamma di fonti. In tal modo l’azienda può evitare i colli di bottiglia relativi all’expertise e focalizzarsi invece sul processo di apprendimento dai propri dati.
Cloud Data Fusion possiede un core open basato sul progetto open source CDAP, che garantisce la portabilità in ambienti ibridi e multi-cloud. L’ampia integrazione di CDAP con piattaforme cloud pubbliche e on-premise può aiutare gli utenti di Data Fusion ad accedere facilmente ai big data e agli strumenti di analytics di Google Cloud, come BigQuery.
Prima della disponibilità generale, Data Fusion ha attraversato la fase beta che è servita a Google per raccogliere il feedback da parte degli utenti. Ciò ha portato a un lavoro di rifinitura e all’aggiunta di alcune funzionalità richieste per l’appunto dagli utenti che hanno provato il servizio.
Tra queste nuove nuove funzionalità ci sono: l’accesso sicuro ai dati on-premise con IP privato; la crittografia dei dati inattivi con Customer Managed Encryption Keys (CMEK); VPC Service Controls per prevenire l’esfiltrazione di dati; e altre.
Questa release di Data Fusion include anche nuovi connettori per integrare i dati da una varietà di database relazionali (SAP Hana, Teradata), archivi NoSQL (MongoDB) e applicazioni SaaS (Salesforce, Google Analytics 360 e altre).
Maggiori informazioni sono disponibili sul sito Google Cloud.