Con l’avvento di ChatGPT l’IA generativa ha rivoluzionato e ha aperto la strada a nuovi settori. Ma cosa c’è di così diverso e cosa significa per i data center? Lo spiegano Doron Hendel, Global Business Development e Kaladhar Voruganti, Senior Business Technologist di Equinix.
Il crescente utilizzo dell’IA generativa comporterà nuove esigenze per l’infrastruttura IT: in primis influenzando l’architettura dei cluster di IA e richiedendo una rete neurale più grande, il che significa più hardware, nonché una migliore struttura di calcolo e set di dati più grandi. Questi fattori comportano un elevato consumo energetico e la necessità di un raffreddamento più efficiente e di una migliore infrastruttura di rete.
Non a caso, secondo l’ultima Global Tech Trends Survey (GTTS) di Equinix, il 42% dei responsabili IT ha dichiarato di non essere sicuro della capacità della propria infrastruttura di far fronte al crescente utilizzo dell’IA. Ma cosa è cambiato rispetto a prima?
IA generativa e tradizionale a confronto
l’IA generativa si differenzia dall’IA tradizionale sotto diversi aspetti. In particolare, mentre l’IA tradizionale classifica i dati e identifica gli schemi all’interno di data set per fare previsioni, l’IA generativa va oltre il semplice riconoscimento degli schemi per creare nuovi contenuti basati sui pattern di allenamento, rappresentati da reti neurali molto più grandi che contengono miliardi o addirittura trilioni di parametri. Per questo i tempi di risposta delle query di IA generativa possono essere più lenti (circa di diversi secondi) rispetto a quelli delle query di IA tradizionale (con tempi di risposta inferiori al secondo) a causa dell’elaborazione supplementare e dei set di dati più grandi; e di conseguenza, l’IA generativa comporta un’infrastruttura di formazione dell’IA molto più grande e un consumo energetico più elevato, richiedendo quindi rack di server più densi e tecniche di raffreddamento avanzate.
Quali sono le sfide principali dell’IA generativa?
Come si può intuire l’IA generativa non è esente da sfide, che possiamo sintetizzare in 4 punti essenziali:
- I dati, perché l’IA generativa cerca e raccoglie dati da tutto il mondo. Possono essere dati pubblici, dati privati di proprietà dell’utente o acquistati e dati di terzi. Il semplice accesso a tutti questi dati è già una sfida, e la protezione della privacy e la conformità alle normative locali aggiungono ulteriore complessità. Le aziende hanno bisogno di un’eccellente governance dei dati per gestirli correttamente durante il ciclo di vita dell’IA generativa. Inoltre la formazione e la creazione di modelli di IA generativa richiedono molte risorse e la maggior parte delle organizzazioni non ha la capacità di crearne di proprie. Per questo, sempre più spesso le aziende utilizzano modelli generativi di IA creati da governi, fornitori di IA o hyperscaler, oppure modelli disponibili su mercati di IA open-source, per poi personalizzarli con i propri dati privati.
- La performance, perché l’IA generativa richiede sistemi di elaborazione ad alte prestazioni progettati per eseguire carichi di lavoro intensivi su larga scala. Tali sistemi necessitano di processori, memoria e hardware specializzato più potenti, come le GPU o i chip personalizzati, oggi disponibili, nonché una rete fisica potente. Solo in questo modo i carichi di lavoro dell’intelligenza artificiale possono raggiungere prestazioni ottimali.
- Sostenibilità, dal momento che i modelli di IA possono generare emissioni più elevate rispetto ai carichi di lavoro IT convenzionali e che l’IA generativa consuma ancora più energia rispetto all’IA tradizionale.
5 implicazioni su cui riflettere
In ragione delle sfide condivise, i carichi di lavoro dell’intelligenza artificiale generativa hanno diverse implicazioni sul modo in cui progettiamo l’architettura dei data center: dalla collocazione dell’infrastruttura, alla costruzione degli edifici, alle opzioni di connettività e altro ancora.
Esaminiamo cinque aree chiave:
- Collocazione fisica: in un mondo sempre più virtuale, è paradossalmente importantissima. I carichi di lavoro di sviluppo dell’intelligenza artificiale generativa necessitano di molta energia, quindi è meglio costruirli in luoghi che possono fornire energia a basso costo, ed essendo sensibili alla latenza non dovrebbero trovarsi in aree altamente popolate. Inoltre, è preferibile ospitarli in luoghi in cui è possibile sfruttare le tecniche di raffreddamento “ad aria libera”. D’altra parte, ha senso collocare i carichi di lavoro di produzione dell’intelligenza artificiale generativa in luoghi periferici, vicino a dove vengono generati i dati; e infine, per soddisfare le normative sulla residenza dei dati e sulla conformità, molte organizzazioni devono distribuire i loro sistemi di produzione di IA in più Paesi, azione semplificabile attraverso un global data center provider.
- Costruzione e gestione di data center: i carichi di lavoro AI di produzione richiedono data center ad alta disponibilità, come altri carichi di lavoro IT. Tuttavia, i requisiti dei data center per i carichi di lavoro di sviluppo dell’IA sono unici per requisiti di potenza: workload di formazione dell’IA generativa possono consumare diversi megawatt di potenza, con la conseguente necessità di adottare tecniche di raffreddamento avanzate come il raffreddamento a liquido.
- Connettività: per creare modelli di IA generativa (sviluppo dell’IA), è necessario un accesso ad alta velocità a molte fonti di dati esterne, ma successivamente, quando si utilizza un modello di IA generativa per la produzione, è necessario disporre di una connettività ad alta larghezza di banda per inserire dati di input multimodali (ad esempio, video, immagini) e di una connettività a bassa latenza con i fornitori di dati esterni (ad esempio, meteo in tempo reale, mercato azionario, traffico, ecc.). È quindi importante ospitare i carichi di lavoro dell’intelligenza artificiale generativa in un data center che offra una connettività sicura e ad alta velocità a più provider di rete per l’ingresso del traffico dall’edge (5G, Wi-Fi, bassa potenza, MPLS, ecc.).
- Sostenibilità: proprio perché i carichi di lavoro dell’IA generativa sono molto affamati di energia, i fornitori di data center devono approvvigionarsi di energia da fonti sostenibili, anche considerando che i governi e gli enti di controllo del settore eserciteranno sempre più pressioni sui provider di servizi di IA affinché ospitino le loro soluzioni in data center ecocompatibili con un basso numero di efficienza di utilizzo dell’energia (PUE).
- Privacy e sicurezza: oltre alla sicurezza a livello di software e di dati, anche la sicurezza fisica dell’infrastruttura è molto importante. Per questo motivo, i fornitori di data center devono fornire gabbie private a cui può accedere solo il cliente, con un monitoraggio video 24 ore su 24, 7 giorni su 7.
Quale futuro per l’IA generativa?
I leader del settore digitale hanno reso l’IA parte della loro strategia di business e di CX già da anni, ma sta assumendo una nuova importanza visti gli enormi progressi con l’IA negli ultimi tempi. Con l’aiuto di strumenti di IA generativa, non è mai stato così facile utilizzare in modo efficace gli enormi volumi di dati disponibili per comprendere meglio molti settori e intraprendere le giuste azioni.
Ma, come illustrato nei paragrafi precedenti, questo strumento deve essere utilizzato con responsabilità e in base a requisiti specifici: solo così mostrerà il suo vero valore.