Amazon Web Services (Aws) ha lanciato le nuove istanze G5 che presentano fino a otto GPU Nvidia A10G Tensor Core.
Potenziate dai processori Amd Epyc di seconda generazione, queste istanze EC2 offrono – ha sottolineato Aws – fino al 40% in più di prestazioni per l’inferenza e le operazioni ad alta intensità grafica, rispetto a quelle precedenti.
Per quel che riguarda le GPU, le A10G forniscono prestazioni fino a 3,3 volte migliori nel training del machine learning, fino a tre volte superiori nell’inferenza del machine learning e fino a tre volte più elevate nelle prestazioni grafiche, rispetto alle GPU T4 delle istanze G4dn.
Ogni GPU A10G ha 24 GB di memoria, 80 core RT (ray-tracing), 320 Tensor Core Nvidia di terza generazione e può fornire fino a 250 TOPS (Tera Operations Per Second) di potenza di calcolo per i workload di intelligenza artificiale.
Le istanze G5 sono particolarmente indicate per i carichi di lavoro di training e inferenza dell’intelligenza artificiale. Offrono anche l’accesso a CuDNN, TensorRT, Triton Inference Server e altri software di machine e deep learning del catalogo Nvidia NGC, tutti ottimizzati per l’utilizzo con le GPU Nvidia.
Un altro caso d’uso tipico di queste istanze è nei settori dei media e dell’intrattenimento. Le aziende possono utilizzare le istanze G5 per supportare le attività di finitura e color grading, generalmente con l’aiuto di strumenti high-end pro-grade.
Queste attività possono anche supportare la riproduzione in tempo reale, aiutata dall’abbondante quantità di larghezza di banda EBS assegnata ad ogni istanza. I clienti Aws possono poi utilizzare la maggiore potenza di ray-tracing delle istanze G5 per supportare gli strumenti di sviluppo dei giochi.
Inoltre, i clienti in molti settori diversi – tra cui media e entertainment, gaming, istruzione, architettura, ingegneria e costruzione – desiderano eseguire workstation grafiche di fascia alta nel cloud e sono alla ricerca di istanze che siano disponibili in una vasta gamma di dimensioni, ha sottolineato Amazon Aws.
Molti dei clienti di Amazon Aws stanno poi progettando e simulando veicoli autonomi che includono più sensori in tempo reale. Tali aziende fanno uso del ray-tracing per simulare l’input dei sensori in tempo reale, e raccolgono anche dati dai test del mondo reale utilizzando strumenti che beneficiano di una rete potente e di grandi quantità di memoria.
Le nuove istanze – ha messo in evidenza Amazon Aws – supportano Linux e Windows, e sono compatibili con una lista molto lunga di librerie grafiche e di machine learning tra cui: CUDA, CuDNN, CuBLAS, NVENC, TensorRT, OpenCL, DirectX, Vulkan e OpenGL.