L’ambiziosa mission di Dynatrace, ribadita dal CEO Rick McConnell nel keynote di apertura di Dynatrace Innovate a Barcellona, è far funzionare perfettamente il software nel mondo. Lo strumento per realizzare questo obiettivo è la piattaforma il cui nome coincide con quello della società, che consente di tenere sotto controllo le applicazioni sempre più complesse e interconnesse e le infrastrutture sulle quali vengono eseguite, automatizzando il più possibile le operazioni di detection e remediation dei problemi che si verificano nel tempo.
Abbiamo incontrato Bernd Greifeneder, attuale Cto di Dynatrace, società da lui fondata nel 2005, per scoprire le potenzialità ed esaminare i componenti della piattaforma . Una soluzione in cloud, che tramite un singolo agente è in grado di garantire visibilità sull’intera infrastruttura, migliorandone anche la sicurezza.
Partiamo dal basso, dalla raccolta dei dati, indispensabile per ogni attività di monitoraggio e a maggior ragione di osservabilità
I clienti installano il nostro agente, OneAgent, nelle loro infrastrutture, e questo si occupa di scoprire automaticamente gli asset connessi. Si chiama OneAgent perché combina osservabilità e sicurezza in una sola soluzione. È l’unico sul mercato in grado di farlo. Queste informazioni sono poi inviate a Grail.
Quindi tutta la conoscenza di Grail proviene dall’agente?
La maggior parte dei dati provengono da OneAgent, perché poi i clienti hanno anche i loro dati di business, o utilizzano soluzioni di OpenTelemetry. Ci sono anche i dati provenienti dagli hyperscaler che vengono integrati. Combiniamo tutte queste informazioni e le archiviamo in Grail. Abbiamo integrato la tecnologia PurePath, per tracciare e dare un contesto a questi dati, e possiamo creare una mappa in tempo reale di queste informazioni con SmartScape.
La mappa di SmartScape ci indica in tempo reale informazioni sulle dipendenze dei vari servizi. Questa mappa è un grafo orientato che rappresenta con precisione le dipendenze di un servizio da un altro, e che permette quindi di fare causazione, di trovare cioè rapporti di causa effetto, non soltanto correlazione tra eventi. Tutti gli altri approcci, inclusi quelli che utilizzano AI basata su reti neurali fanno soltanto correlazione. Lavorano sulla coincidenza degli eventi in base al timestamp, al momento in cui si verificano. Non è sufficiente. Faccio un esempio: se qualcuno mi sta vicino, non vuol dire che siamo una coppia. Non c’è dipendenza necessaria.
Questo graph poi va ad alimentare Davis AI, che lo analizza tramite algoritmi di intelligenza artificiale in grado di identificare la causa profonda (root cause) di eventuali problemi. Altri sistemi magari ti inviano centinaia di alert. Sono troppi, e magari ignorano un alert arrivato cinque minuti prima che crea un effetto a cascata. Come fai a capire se è correlato o meno? Per questo la correlazione in alcuni casi non riesca a risolvere il problema, e rischia di generare un grande volume di falsi positivi. Questa AI, invece, ti dà informazioni specifiche su un problema. Ti dice quali servizi sono impattati, gli utenti che sono coinvolti, quali no.
Utilizziamo OneAgent anche per questioni legate alla sicurezza. Quando per esempio rilevi delle attività sospette sul tuo frontend, come fai a sapere sa questa è una priorità per il team IT? In questi casi, agire tempestivamente fa la differenza. Davis AI si occupa quindi di analizzare questi comportamenti per comprendere il reale rischio nelle varie aree, comprendendo se va intaccare informazioni sensibili, se invia dati tramite Internet. A questo punto valuta il punteggio di rischio da assegnare all’evento, sgravando quindi il team IT dal dover valutare manualmente le priorità.
OneAgent raccoglie dati anche sui desktop degli utenti?
No, non ci occupiamo di sicurezza degli endpoint. Questo lo lasciamo ad altre imprese, ma integriamo anche i dati provenienti da soluzioni di terze parti. Per esempio, SentinelOne, perché i reparti IT lo utilizzano per proteggere Microsoft 365. Lo scopo della piattaforma è quello di automatizzare processi, mettendo insieme i dati provenienti da differenti soluzioni. Anche se non installiamo agenti sugli endpoint, possiamo comunque vedere il traffico generato da queste macchine, e questo entra a far parte della topologia e del contesto. Permette di porre rimedio più velocemente e automaticamente agli incidenti informatici.
Tutti i dati raccolti da OneAgent e dalle altre fonti vanno in Grail, il vostro data lake house proprietario
Grail è stato realizzato da zero da Dynatrace, perché non esistono database che possono combinare i graph con gli eventi, le time series, le sessioni degli utenti e i metadati. Non su questa scala, per lo meno. Parliamo di exabyte di dati. Serve una capacità massiva di calcolo parallelo per farlo.
Nel nome Grail, Gr sta a significare “graph”, “ai” è un riferimento all’IA ed “l” è l’iniziale di limitless, senza limiti. Questa per farti capire l’idea che sta alla base di Grail.
Abbiamo una tecnologia che si chiama Data Work Bin che ci permette di trovare velocemente le informazioni, anche in assenza di indici. È proprio questa combinazione che rende la piattaforma così potente.
Grail è una soluzione progettata per gestire enormi quantità di dati, escludendo dati transazionali. Noi, per esempio, trasferiamo in Grail l’80% dei dati generati da Snowflake, le statistiche di utilizzo e di comportamento, escludendo soltanto i dati relativi al billing. I motivi di questo approccio sono due: la prima è che ci consente una maggiore flessibilità nell’accesso ai dati. La seconda è che spostando i dati da Snowflake a Grail evitiamo i problemi relativi a sicurezza e privacy. Invece di spostare i dati da un posto all’altro, sono tutti conservati qui. La tecnologia di protezione dati che utilizziamo permette di avere istanze completamente isolate l’una dall’altra. Questo evita di dover adottare strumenti di data flow e di analytics, per esempio. Evita anche di adottare strumenti di controllo dati, perché tutte le informazioni elaborate sulla piattaforma sono acquisite automaticamente. Questo rende anche semplicissima l’integrazione con Azure ID. Ed evita anche di dover adottare tutta una serie di mini-tool, che rappresentano un potenziale problema per la sicurezza.
Quindi ogni cliente accede alla sua personale istanza di Grail?
No, abbiamo scelto di non farlo. Parliamo di un’infrastruttura basata su migliaia di CPU. Non potremmo permettercela, a meno di far pagare a ogni cliente un abbonamento dal 300.000 dollari all’anno. Poi per garantire le elevate performance offerte da Grail abbiamo bisogno di un’infrastruttura condivisa. Ogni query è elaborata in parallelo, così da completarla velocemente. Se ogni cliente potesse accedere solo a una CPU alla volta, le prestazioni sarebbero molto inferiori. I dati rimangono separati, tuttavia. Anche se facendo collective intelligence si potrebbero avere risultati ancora migliori in termini di protezione dagli attacchi alla sicurezza, preferiamo rispettare al massimo la privacy di ciascun cliente.
Otteniamo queste prestazioni grazie a un codice scritto in maniera molto efficiente, ottimizzando ogni piccola sequenza di codice. Per esempio, evitiamo di fare garbage collection. E utilizziamo in maniera intelligente gli strumenti messi a disposizione dagli hyperscaler. Ora tutte le nuove funzionalità di Dynatrace sono gestite da AppEngine, che può venire utilizzato anche dai nostri clienti. Questo significa che ogni cliente può realizzare le sue applicazioni – che sono poi certificate da Dynatrace in termini di funzionalità e usabilità – che fanno leva su SmartScape e Davis AI.
Andando avanti, la piattaforma include anche l’Automation Engine, che va oltre i semplici workflow e che supporta funzionalità di automation as code. App Engine e Automation Engine sono utilizzati in maniera estensiva su tutta la piattaforma. Per esempio, lo usiamo per creare connettori alle sorgenti di dati, strumenti per la distribuzione di software e via dicendo. Tutti i casi d’uso che abbiamo generato sono stati realizzati tramite queste funzionalità della nostra piattaforma. Questo significa che tutta l’infrastruttura per la visibilità ha accesso alle stesse informazioni provenienti dai log, per esempio quelli di business e gli analytics. Questo significa che i clienti devono caricare i dati una sola volta, e poi sono utilizzati per differenti fini. In questa maniera possiamo ottimizzare la nostra soluzione per specifici settori.
Il fatto che i criminali informatici stiano iniziando a usare l’IA come sta cambiando il panorama della cybersecurity?
Sì. Stanno utilizzando l’IA generativa per creare nuovi strumenti di attacco. Questo secondo me implica che per la sicurezza non dobbiamo concentrarci sulla reazione agli attacchi, ma sviluppare soluzioni in grado di respingere anche attacchi sconosciuti. Che è quello che fa OneAgent.
Quali sono le sfide per il futuro di Dynatrace?
A oggi, il nostro obiettivo è quello di concentrarci sulla crescita. Stiamo crescendo come numero di dipendenti e di clienti, sul reinventarci costantemente. Al momento puntiamo a migliorare la nostra organizzazione interna, più che il prodotto.
Cosa puoi dirmi sulla recente acquisizione di Rookout?
Al momento ci siamo occupati dell’onboarding del personale. Prima di qualche annuncio ufficiale, però, dovrai attendere il prossimo anno. Non abbiamo intenzione di integrare le loro applicazioni tramite API, non avrebbe senso. Vogliamo integrarle completamente nella piattaforma.