Splunk, specialista nella cybersecurity e nell’observability, ha pubblicato il report The State of Observability 2024 in collaborazione con Enterprise Strategy Group (ESG). Questo studio globale ha esaminato il ruolo dell’observability all’interno dei sempre più complessi ambienti IT e delle crescenti aspettative dei clienti.
Il report evidenzia come l’observability si sia evoluta in un elemento di differenziazione competitiva, con i leader dell’observability che ottengono un ritorno annuo di 2,6 volte sui loro investimenti in aree come l’efficienza operativa e l’uptime. Queste organizzazioni risolvono i problemi più rapidamente, aumentano la produttività degli sviluppatori, controllano i costi e migliorano la soddisfazione dei clienti.
A causa di tali vantaggi, l’86% di tutti gli intervistati prevede di aumentare i propri investimenti in observability. Il quarto report annuale, condotto su 1.850 ITOps e sviluppatori, fornisce la più completa analisi del settore sull’observability.
La costruzione di una pratica di observability di rilievo
Le principali pratiche di observability non si realizzano per caso, ma sono costruite in modo strategico, sottolinea Splunk. Il report delinea un nuovo quadro di maturità che consiste in quattro fasi di sofisticazione dell’observability:
- Visibilità fondamentale
- Insight guidati
- Risposta proattiva
- Workflow unificati
Sulla base di questo quadro, gli esperti intervistati sono stati inseriti in una delle quattro fasi di maturità dell’observability: organizzazioni “agli inizi” (45%); Organizzazioni “emergenti” (27%); Organizzazioni “in evoluzione” (17%); e infine, le organizzazioni “leader” o Leader (11%).
I leader risolvono i problemi più rapidamente, riducendo l’impatto del downtime
Adottando una metodologia di observability all’avanguardia, un’organizzazione può rendersi conto dell’intera digital footprint e ridurre l’impatto dei downtime. Il 68% delle organizzazioni “leader” afferma di essere a conoscenza dei problemi delle applicazioni entro pochi minuti o secondi da un’interruzione, 2,8 volte più velocemente rispetto al tasso delle organizzazioni “agli inizi”.
Le organizzazioni leader stimano che l’80% degli alert sia legittimo, rispetto al 54% delle organizzazioni “agli inizi”, fornendo una maggiore certezza e riducendo il tempo dedicato alla risoluzione dei falsi allarmi. Questa differenza in termini di precisione e tempo di risposta è significativa, in quanto le aspettative dei clienti per esperienze digitali seamless e sicure sono ai massimi storici. Le ricerche dimostrano che i tempi di inattività possono indebolire la fedeltà dei clienti e danneggiare la percezione pubblica.
La velocità offre alle organizzazioni leader un vantaggio nella rapidità di sviluppo del software. Il 76% dei leader implementa la maggior parte del codice dell’applicazione su richiesta, rispetto al 30% delle organizzazioni “agli inizi”. Inoltre, gli sviluppatori delle organizzazioni leader dedicano il 38% in più del loro tempo all’innovazione rispetto alle organizzazioni “agli inizi”, il che significa poter dedicare meno tempo a lavori faticosi come la risoluzione dei problemi e la gestione degli incidenti. È chiaro che per le organizzazioni leader, l’aumento della produttività e dei risultati degli sviluppatori favorisce la redditività.
“Costruire una pratica di osservabilità leader significa essere ossessionati dall’offrire esperienze digitali incredibili ai propri clienti e incorporare questa mentalità in ogni decisione”, ha dichiarato Patrick Lin, Senior Vice President e General Manager, Observability di Splunk. “Il nostro rapporto mostra che questa mentalità paga. I leader non solo ottengono un maggiore successo nella mitigazione dei tempi di inattività, ma vedono anche una maggiore innovazione e velocità degli sviluppatori”.
OpenTelemetry è il caposaldo per una procedura di observability di successo
OpenTelemetry, uno standard di settore open source per la raccolta di dati, sta diventando sempre più diffuso. Il progetto Cloud Native Computing Foundation (CNCF) offre alle organizzazioni il controllo sui propri dati e riduce il vendor lock-in. Il report evidenzia come OpenTelemetry sia il fulcro per una procedura di observability efficace, con il 58% che afferma che la propria soluzione di observability si basa su OpenTelemetry.
- OpenTelmetry è sinonimo di innovazione e resilienza, con il 78% dei leader che abbraccia lo standard open source e il 57% che riscontra costi di observability
- OpenTelemetry offre una flessibilità senza precedenti. Il 72% dei leader adotta OpenTelemetry per accedere a un ecosistema più ampio di tecnologie e il 65% afferma che il progetto open source facilita il controllo e la proprietà dei dati.
L’AI migliora l’efficienza operativa
L’utilizzo dell’intelligenza artificiale e del machine learning nell’ambito dell’observability è ormai un dato di fatto. Quasi tutti gli intervistati (97%) utilizzano sistemi basati sull’AI e/o sul ML per migliorare le proprie operazioni di observability, con un notevole incremento rispetto al 66% degli intervistati lo scorso anno. Grazie alle capacità di AI e ML di analizzare ed elaborare grandi volumi di dati per rilevare anomalie, identificare le cause principali, consigliare azioni e automatizzare le attività, i team ottengono gli insight di cui hanno bisogno più rapidamente.
- Il 57% degli intervistati concorda sul fatto che il volume di alert che riceve è preoccupante. I leader riscontrano molto meno alert noise, con l’85% che risolve metà o più dei propri alert grazie alle segnalazioni di strumenti basati su AI/ML. In netto contrasto, solo il 16% delle organizzazioni “agli inizi” afferma lo stesso.
- Il 65% dei leader si affida all’AIOps per individuare e risolvere le cause principali degli incidenti con maggiore intelligenza e automazione.
La platform engineering anticipa il futuro dei DevOps
La platform engineering sta guidando e migliorando l’esperienza degli sviluppatori, con il 73% degli intervistati che la pratica ampiamente. Fondamentalmente, la platform engineering incarna un approccio in cui gli ingegneri del software utilizzano toolchain, workflow e piattaforme self-service comuni, in modo da poter dedicare meno tempo alla gestione dei propri strumenti e concentrarsi maggiormente sulla promozione di nuovi prodotti innovativi sul mercato. Questa disciplina arriva in un momento favorevole per gli ITOps e i team di ingegneri più estesi, poiché il 66% degli intervistati afferma che nell’ultimo anno il personale più esperto in azienda ha annunciato le proprie dimissioni a causa del burnout.
- Le organizzazioni con team dedicati a questa pratica stanno vedendo i risultati. Quando è stato chiesto loro di classificare i primi tre risultati della platform engineering, il 55% degli intervistati ha dichiarato di aver aumentato l’efficienza delle operazioni IT, il 42% di aver migliorato le prestazioni delle applicazioni e il 40% di aver aumentato la produttività degli sviluppatori.
- Il 58% dei leader considera la platform engineering come un fattore di differenziazione competitiva.
Per ulteriori approfondimenti sullo State of Observability 2024 report, è possibile visitare la pagina del report o il blog dedicato.
Metodologia
L’indagine globale è stata condotta a maggio e giugno 2024 in collaborazione con l’Enterprise Strategy Group. Il report ha intervistato 1.850 dipendenti, manager e dirigenti ITOps, oltre a sviluppatori, ingegneri, architetti e SRE di organizzazioni con 500 o più dipendenti a tempo pieno e che conoscono le pratiche di observability della loro organizzazione. Gli intervistati provengono da 10 paesi: Australia, Francia, Germania, Italia, India, Giappone, Nuova Zelanda, Singapore, Regno Unito e Stati Uniti. Rappresentavano anche 16 settori: aerospaziale e difesa, servizi alle imprese, beni di consumo confezionati, istruzione, servizi finanziari, governo, sanità, scienze della vita, produzione, tecnologia, media, petrolio/gas, vendita al dettaglio/ingrosso, telecomunicazioni, trasporti/logistica e servizi pubblici.