E4 Computer Engineering, azienda italiana specializzata nel settore delle soluzioni hardware e software ad alto contenuto tecnologico per l’Intelligenza Artificiale, l’High-Performance Computing (HPC), il Quantum Computing (QC), il Cloud Computing e la Data Analytics, ha progettato e realizzato, insieme all’Istituto Italiano di Tecnologia (IIT), il recente potenziamento del cluster Franklin, supercomputer dell’IIT che svolge un ruolo fondamentale a sostegno degli studi e dei ricercatori dell’Istituto.
Fondato nel 2003, con 14 centri di ricerca, più di 1300 brevetti all’attivo e 35 startup generate, l’IIT si è significativamente evoluto nel corso degli anni, vedendo parallelamente crescere le proprie esigenze in termini di infrastrutture digitali e capacità di calcolo.
Per questo, nel 2020, E4 aveva realizzato – a partire dalla progettazione del datacenter per l’Istituto – il supercomputer Franklin, dotato di capacità computazionale di 1 PFlops e gestito utilizzando i paradigmi classici dell’HPC, dalla gestione dell’infrastruttura (ogni nodo destinato sostanzialmente a una missione) alla user experience dei ricercatori basata su interfaccia testuale e sottomissione di job in batch.
Tuttavia, le attuali necessità dell’HPC moderno e della ricerca data driven rendono il solo accesso in modalità batch troppo limitato, mentre l’estrema complessità e diversità degli strumenti usati in diverse linee di ricerca non permettono di avere una gestione dei nodi di calcolo troppo statica.
Per queste ragioni, l’attuale upgrade realizzato da E4 è incentrato su due aspetti: da un lato il potenziamento dell’infrastruttura secondo criteri di sostenibilità (accrescendo del 50% la potenza computazionale di Franklin a fronte di un aumento del 10% dell’hardware) dall’altro l’adozione di nuovi approcci per la gestione dell’infrastruttura e per l’accesso alle risorse.
La soluzione Medooza di E4 per l’HPC, infatti, prevede di gestire un cluster secondo i paradigmi del cloud e dell’Infrastructure as a Code, garantendo la capacità di riconfigurare rapidamente on demand e la riproducibilità delle configurazioni stesse.
All’interno di Medooza, la componente ICE4HPC di E4 permette di far coesistere sulla stessa infrastruttura calcoli in modalità batch e in modalità interattiva, basati sull’uso di notebook e di interfacce browser, ed in particolare l’accesso alle risorse GPU in modalità interattiva e condivisa.
A differenza dell’HPC tradizionale, per le linee di ricerca data driven l’accesso alle risorse in modalità interattiva è un requisito fondamentale.
Calcolo interattivo e visualizzazione sono aspetti critici per la ricerca in ambito Artificial Intelligence e proprio l’interazione tra metodi AI e simulazioni fisiche tradizionali sono al centro degli studi più avanzati portati avanti tramite le risorse e le modalità di interazione messe a disposizione da Franklin.
A seguito degli interventi di upgrade, il cluster Franklin è stato dunque significativamente ottimizzato e ha raggiunto un dimensionamento utile agli scopi dell’istituto, consentendone l’utilizzo da parte di una notevole quantità di linee di ricerca e con oltre 250 utenti attivi.
“Questo nuovo capitolo della nostra collaborazione con IIT, iniziata nel 2008 e consolidatasi nel corso degli anni attraverso passaggi fondamentali come la prima realizzazione del cluster Franklin, è per noi motivo di particolare orgoglio perché conferma la nostra capacità, progettuale e di know-how, di accompagnare un ente prestigioso e di rilevanza nazionale nel suo percorso evolutivo di utilizzo del supercomputing al servizio dell’innovazione e della ricerca”, ha commentato Cosimo Damiano Gianfreda, CEO di E4 Computer Engineering.
“Nel corso del tempo si è compreso come l’HPC non fosse un asset soltanto di nicchia, per esempio ristretto alla simulazione atomistica, ma al contrario un fattore abilitante del tutto trasversale. Si è quindi realizzata una infrastruttura a disposizione di tutta la comunità scientifica di IIT per abilitare e accelerare la scoperta in tutti i domini computazionali dell’istituto”, ha sottolineato Sergio Decherchi, Coordinatore della Facility di Data Science and Computation (DSCF).
Il cluster Franklin viene gestito da DSCF, che mette a disposizione la potenza di calcolo del supercomputer all’intero Istituto permettendo un impiego massiccio di tecniche di machine learning e analisi dati che hanno la necessità di accedere a risorse preziose quali proprio le GPU.