In occasione di SC23, Intel ha presentato le GPU per data center Intel Max Series, gli acceleratori AI Intel Gaudi2 e i processori Intel Xeon con prestazioni ai vertici per l’High Performance Computing (HPC) accelerato dall’intelligenza artificiale (AI).
In collaborazione con Argonne National Laboratory, Intel ha condiviso i progressi del progetto Aurora di AI generativa (genAI), incluso un aggiornamento su GPT-3 LLM da 1.000 miliardi di parametri sul supercomputer Aurora, reso possibile dall’esclusiva architettura della GPU Max Series.
Intel e Argonne hanno dimostrato l’impulso dato dai supercomputer alla ricerca scientifica con le applicazioni dell’Aurora Early Science Program e dell’Exascale Computing Project. L’azienda ha inoltre illustrato il percorso verso gli acceleratori AI Intel Gaudi3 e Falcon Shores.
“Intel è da sempre impegnata a fornire soluzioni tecnologiche innovative per soddisfare le esigenze della comunità HPC e IA. Le eccezionali prestazioni delle nostre CPU Xeon insieme alle GPU e CPU Max Series aiutano a promuovere la ricerca. Ciò, unito ai nostri acceleratori Gaudi, dimostra come la nostra completa gamma di tecnologie sia in grado di fornire agli utenti proposte convincenti per soddisfare i loro diversi carichi di lavoro”, afferma Deepak Patil, corporate vice president and general manager of Data Center AI Solutions di Intel.
L’AI generativa per la scienza, insieme ai più recenti risultati di prestazioni e benchmark, sottolineano la capacità di Intel di fornire soluzioni su misura per le esigenze specifiche degli utenti di HPC e IA, mette in evidenza la società americana. L’approccio software-based di Intel con oneAPI e toolkit potenziati da HPC e intelligenza artificiale aiuta gli sviluppatori a trasferire senza problemi il proprio codice tra framework architettonici per accelerare la ricerca scientifica. Inoltre, le GPU e le CPU della serie Max verranno implementate in molteplici supercomputer che saranno presto online.
Argonne National Laboratory ha condiviso i progressi sulle sue iniziative di intelligenza artificiale generativa per la scienza con il supercomputer Aurora. Il progetto Aurora genAI è una collaborazione tra Argonne, Intel e altri partner per creare modelli di intelligenza artificiale fondamentali per lo sviluppo della ricerca scientifica. I modelli saranno addestrati su testi scientifici, codici e dataset scientifici su scale di oltre 1.000 miliardi di parametri provenienti da diversi domini scientifici. Utilizzando le tecnologie fondamentali di Megatron con DeepSpeed, il progetto genAI sosterrà molteplici discipline scientifiche, tra cui la biologia, la ricerca sul cancro, la scienza del clima, la cosmologia e la scienza dei materiali.
La caratteristica architettura della GPU Intel Max Series e le funzionalità del sistema di supercomputer Aurora possono gestire in modo efficiente modelli da 1.000 miliardi di parametri con soli 64 nodi, molto meno di quanto sarebbe normalmente richiesto, sottolinea Intel. L’Argonne National Laboratory ha eseguito quattro istanze su 256 nodi, dimostrando la capacità di eseguire più istanze in parallelo su Aurora, aprendo la strada per scalare più rapidamente l’addestramento di migliaia di miliardi di modelli di parametri con migliaia di miliardi di token su più di 10.000 nodi.
Intel e Argonne National Laboratory hanno dimostrato l’accelerazione su larga scala della ricerca scientifica consentita dalle funzionalità del sistema e dallo stack software su Aurora. Alcuni esempi di carico di lavoro riportati da Intel includono:
- La ricostruzione del connettoma cerebrale su grande scala con Connectomics ML, mostrando un throughput di inferenza su più di 500 nodi di Aurora.
- Il General Atomic and Molecular Electronic Structure System (GAMESS) ha mostrato prestazioni doppie con la GPU Intel Max rispetto a Nvidia A100, afferma l’azienda. Ciò consente la modellazione di complicati processi chimici nella progettazione di farmaci e catalizzatori per svelare i segreti della scienza molecolare con il supercomputer Aurora.
- Il codice HACC (Hardware/Hybrid Accelerated Cosmology Code) ha dimostrato di funzionare su più di 1.500 nodi di Aurora, consentendo la visualizzazione e la comprensione della fisica e dell’evoluzione dell’universo.
- L’applicazione di inferenza AI per lo screening dei farmaci, parte del progetto ESP (Early Science Project) Aurora Drug Discovery, migliora notevolmente l’efficienza dei dataset legati ai componenti chimici consentendo lo screening di oltre 20 miliardi dei composti più sintetizzati su soli 256 nodi.
Intel ha inoltre mostrato maggiori prestazioni nell’HPC e l’AI, nonché ottimizzazioni software su hardware e applicazioni.
Intel e Dell hanno pubblicato i risultati di STAC-A2, una suite di benchmark indipendente basata su carichi di lavoro di analisi dei rischi di mercato reali, che mostrano ottime prestazioni per il settore finanziario. Rispetto a otto GPU Nvidia H100 PCIe, sostiene l’azienda, quattro GPU Intel Data Center Max 1550 hanno prestazioni più elevate del 26% in termini di warm Greeks 10-100k-1260 e un’efficienza spaziale 4,3 volte superiore.
L’azienda aggiunge inoltre che la GPU Intel Data Center GPU Max Series 1550 supera la scheda PCIe Nvidia H100 in media del 36% (1,36x) su diversi carichi di lavoro HPC. E che la serie Intel Data Center GPU Max offre un supporto migliorato per i modelli IA, inclusi più modelli LLM (Large Language) come GPT-J e LLAMA2.
Intel afferma poi che Xeon CPU Max Series, l’unico processore x86 con memoria a larghezza di banda elevata (HBM), ha fornito prestazioni medie superiori del 19% rispetto al processore AMD Epyc Genoa.
La scorsa settimana, MLCommons ha pubblicato i risultati del benchmark MLPerf training v3.1 per i modelli di training AI. Intel Gaudi2 ha significativamente mostrato un raddoppio di prestazioni implementando il data type FP8 sul benchmark v3.1 di training GPT-3.
Intel ha annunciato che introdurrà l’acceleratore AI Intel Gaudi3 nel 2024. Sarà basato sulla stessa architettura ad alte prestazioni di Gaudi2 e si prevede che fornirà 4 volte la potenza di calcolo (BF16), raddoppiando l’ampiezza di banda di rete per prestazioni maggiormente scalabili e 1,5 volte la memoria HBM integrata per gestire prontamente la crescente domanda di calcolo ad alte prestazioni ed alta efficienza di LLM senza degrado delle prestazioni.
I processori Intel Xeon di quinta generazione offriranno prestazioni fino a 1,4 volte superiori rispetto alla generazione precedente sulle applicazioni HPC, come dimostrato da LAMMPS-Copper.
Granite Rapids, un futuro processore Intel Xeon, offrirà un numero maggiore di core e accelerazione integrata con Intel Advanced Matrix Extensions e supporto per DIMM Multiplexer Combined Ranks (MCR). Granite Rapids avrà un’inferenza AI DeepMD+LAMMPS 2,9 volte migliore. MCR raggiunge velocità di 8.800 megatransfer al secondo basate su DDR5 e oltre 1,5 terabyte al secondo di capacità di larghezza di banda della memoria in un sistema a due socket, che è fondamentale per alimentare il numero di core in rapida crescita delle moderne CPU e consentire efficienza e flessibilità.
Intel ha poi annunciato funzionalità per i propri strumenti di sviluppo software 2024 che migliorano lo sviluppo di software aperto basato sulla programmazione multiarchitettura oneAPI. Nuovi strumenti aiutano gli sviluppatori a estendere le nuove funzionalità AI e HPC su CPU e GPU Intel con una copertura più ampia, comprese prestazioni e implementazioni più veloci utilizzando Python standard per carichi di lavoro numerici e miglioramenti del compilatore che offrono un’implementazione SYCL 2020 quasi completa per migliorare la produttività e l’offload del codice.
Inoltre, Texas Advanced Computing Center (TACC) ha annunciato il proprio Centro di Eccellenza oneAPI che si concentrerà su progetti che sviluppano e ottimizzano codici di benchmark per l’imaging sismico. Intel promuove la creazione di un ambiente in cui l’innovazione e la ricerca software e hardware facciano avanzare il settore, con 32 centri di eccellenza oneAPI in tutto il mondo, sottolinea la società di Santa Clara.
Per quanto riguarda i prossimi sviluppi, Intel ha sottolineato il proprio impegno nell’intelligenza artificiale e nei supercomputer e ha evidenziato gli sviluppi del mercato. Le nuove implementazioni di supercomputer con tecnologie GPU e CPU Intel Max Series includono sistemi come Aurora, Dawn Phase 1, SuperMUC-NG Phase 2, Clementina XX1 e altri. I nuovi sistemi dotati di acceleratori Intel Gaudi2 includono un grande supercomputer AI con Stability AI come cliente principale.
Questo slancio sarà fondamentale per Falcon Shores, la GPU Intel di prossima generazione per AI e supercomputer. Falcon Shores sfrutterà la proprietà intellettuale (IP) di Intel Gaudi e Intel Xe con un’unica interfaccia di programmazione GPU basata su oneAPI. Le applicazioni basate oggi sugli acceleratori AI Intel Gaudi e sulle GPU Intel Max Series potranno migrare facilmente a Falcon Shores in futuro, informa l’azienda.