martedì, Aprile 30, 2024
HomeIN EVIDENZASupercomputer: il sistema Frontier dell'Oak Ridge National Laboratory (ORNL) infrange la barriera...

Supercomputer: il sistema Frontier dell’Oak Ridge National Laboratory (ORNL) infrange la barriera dell’exaflop

Grazie alla più recente architettura Cray EX235a ed ai processori AMD EPYC 64C a 2 GHz, Frontier ha raggiunto un punteggio HPL di 1,102 Exaflop/s.

La 59^ edizione della classifica TOP500 ha dimostrato che il sistema Frontier è la prima vera macchina di tipo exascale, con un punteggio HPL di 1,102 Exaflop/s.

Il sistema Frontier, in funzione presso l’Oak Ridge National Laboratory (ORNL) negli Stati Uniti, occupa ora il primo posto nella speciale classifica TOP500. Basato sulla più recente architettura HPE Cray EX235a, e dotato di processori AMD EPYC 64C a 2GHz, il sistema utilizza complessivamente 8.730.112 core, presenta un’efficienza energetica di 52,23 gigaflops/watt e si basa su Gigabit Ethernet per il trasferimento dei dati.

Con un punteggio HPL di 1,102 Exaflop/s, Frontier non è solo il supercomputer più potente mai esistito, ma è anche la prima vera macchina exascale.

La prima posizione era stata precedentemente detenuta per due anni consecutivi dal sistema Fugaku presso il RIKEN Center for Computational Science (R-CCS) a Kobe, in Giappone. Con il suo precedente punteggio di benchmark HPL di 442 Pflop/s che è rimasto invariato, Fugaku è ora sceso al secondo posto della classifica. In considerazione del fatto che il picco teorico di Fugaku supera 1 exaflop, è possibile definire anche questo sistema come appartenente alla categoria exascale. Tuttavia, Frontier è l’unico sistema in grado di dimostrarlo nel test di benchmark HPL.

Un altro significativo cambiamento all’interno della TOP10 è l’introduzione del sistema LUMI di EUROHPC/CSC in Finlandia, il più potente sistema europeo, che va ad occupare il terzo posto in classifica. Questo nuovo sistema utilizza 1.110.144 core e ha un benchmark HPL di quasi 152 Pflop/s.

Infine, un altro cambiamento all’interno della TOP10 si è verificato al numero 10 con la nuova aggiunta del sistema Adastra, in funzione al GENCI-CINES in Francia. Ha ottenuto un punteggio di benchmark HPL di 46,1 Pflop/s ed è la seconda macchina più potente in Europa, dietro a LUMI.

Da segnalare lo stop ai vertici della classifica dei sistemi cinesi che per alcuni anni hanno dominato la TOP500.

Si conferma al 12° posto il supercomputer HPC5 dell’ENI, con un benchmark di 35,45 Pflop/s; HPC5 è un sistema basato su PowerEdge C4140, Xeon Gold 6252 24C 2.1GHz, NVIDIA Tesla V100, Mellanox HDR Infiniband, DELL EMC.

Il sistema Marconi-100 del Cineca di Bologna si piazza al 21° posto con un benchmark di 21,64 Pflop/s.

Ecco un riepilogo delle prime dieci posizioni:

  • Frontier è il nuovo sistema n. 1 nella TOP500. Questo sistema, basato su HPE Cray EX, è il primo degli Stati Uniti con prestazioni di picco superiori a un ExaFlop/s. È attualmente in fase di integrazione e test presso l’ORNL nel Tennessee, dove sarà gestito dal Dipartimento dell’Energia (DOE). Attualmente ha raggiunto 1,102 Exaflop/s utilizzando 8.730.112 core. La nuova architettura HPE Cray EX combina CPU AMD EPYC di terza generazione ottimizzate per HPC e AI con acceleratori AMD Instinct 250X e interconnessione Slingshot-11.
  • Fugaku, ora secondo in classifica, è installato presso il RIKEN Center for Computational Science (R-CCS) a Kobe, in Giappone. Ha 7.630.848 core che gli hanno permesso di raggiungere un benchmark HPL di 442 Pflop/s, con prestazioni tre volte superiori al terzo classificato.
  • Il nuovo LUMI, un altro sistema HPE Cray EX installato presso il centro EuroHPC presso CSC in Finlandia, è il nuovo n. 3 con una performance di 151,9 Pflop/s. La European High-Performance Computing Joint Undertaking (EuroHPC JU) sta mettendo in comune le risorse europee per sviluppare supercomputer Exascale di fascia alta per l’elaborazione di big data. Uno dei supercomputer paneuropei pre-Exascale è proprio LUMI, che si trova nel data center CSC a Kajaani, in Finlandia.
  • Summit, un sistema costruito da IBM presso ORNL nel Tennessee, USA, occupa ora il 4° posto al mondo con una performance di 148,8 Pflop/s nel benchmark HPL che viene utilizzato per stilare la lista TOP500. Summit ha 4.356 nodi, ognuno dei quali ospita due CPU Power9 con 22 core e sei GPU NVIDIA Tesla V100, ciascuna con 80 multiprocessori di streaming (SM). I nodi sono collegati tra loro con una rete Mellanox dual-rail EDR InfiniBand.
  • Sierra, un sistema del Lawrence Livermore National Laboratory, CA, USA, è al n. 5. La sua architettura è molto simile al Summit: utilizza 4.320 nodi con due CPU Power9 e quattro GPU NVIDIA Tesla V100. Sierra ha raggiunto 94,6 Pflop/s.
  • Sunway TaihuLight è un sistema sviluppato dal National Research Center of Parallel Computer Engineering & Technology (NRCPC) della Cina, ed è installato presso il National Supercomputing Center di Wuxi, nella provincia cinese di Jiangsu. Ha raggiunto i 93 Pflop/s.
  • Perlmutter, al settimo posto in classifica, si basa sulla piattaforma HPE Cray “Shasta”, è un sistema eterogeneo con nodi basati su AMD EPYC e 1536 nodi accelerati NVIDIA A100. Perlmutter ha raggiunto i 64,6 Pflop/s
  • Al numero 8 troviamo Selene, un SuperPOD NVIDIA DGX A100 installato internamente presso NVIDIA negli Stati Uniti. Il sistema si basa su un processore AMD EPYC con NVIDIA A100 per l’accelerazione e un Mellanox HDR InfiniBand come rete. Ha raggiunto 63,4 Pflop/s.
  • Tianhe-2A (Milky Way-2A), un sistema sviluppato dalla National University of Defense Technology (NUDT) cinese e distribuito presso il National Supercomputer Center di Guangzhou, in Cina, occupa ora la nona posizione in classifica con 61,4 Pflop/s.
  • Il sistema Adastra installato presso GENCI-CINES è una novità della classifica, ed occupa ora la decima posizione. È il terzo nuovo sistema HPE Cray EX e il secondo sistema più veloce in Europa. Ha raggiunto 46,1 Pflop/s.

Ancora una volta, i processori AMD sembrano essere una tecnologia vincente per i sistemi HPC. Frontier utilizza CPU AMD EPYC di terza generazione ottimizzate per HPC e AI. Anche il sistema LUMI (n. 3) si basa su processori AMD EPYC di terza generazione, mentre Permutter (n. 7) utilizza processori AMD EPYC 7763 e Selene (n. 8) impiega processori AMD EPYC 7742.

Cina e Stati Uniti sono i due paesi con il maggior numero di sistemi nell’elenco. Tuttavia, mentre la Cina è rimasta ferma a 173 supercomputer, gli Stati Uniti sono scesi da 150 sistemi a 126; questi due paesi rappresentano quasi i due terzi dei supercomputer della TOP500.

Per quanto riguarda le interconnessioni di sistema, Ethernet ha vinto con 226 macchine, in calo rispetto alle 240 macchine dell’elenco precedente. Infiniband conta ora 196 sistemi contro i 180 della classifica precedente. Omnipath è rimasto stabile con 40 macchine, mentre le interconnessioni personalizzate sono scese da 34 connessioni dell’ultima classifica alle 32 attuali. Solo sei sistemi utilizzano reti proprietarie.



Classifica GREEN500

Il sistema al primo posto di questa particolare classifica che segnale i supercomputer più parsimoniosi nel rapporto prestazioni/consumi, è il Frontier Test & Development System (TDS) presso ORNL negli Stati Uniti. Con 120.832 core totali e un benchmark HPL di 19,2 Pflop/s, la macchina Frontier TDS è fondamentalmente solo un rack del sistema Frontier attuale, ma presenta alcune capacità di efficienza impressionanti. Infatti, con un’efficienza energetica di 62,8 gigaflops/watt, Frontier TDS è il leader indiscusso della classifica GREEN500.

In considerazione delle nuove capacità di calcolo raggiunte, l’efficienza energetica sta diventando una priorità assoluta per le strutture HPC, e non è un caso che le macchine più potenti siano anche le più efficienti.

Continuando con questa tendenza, e forse anche ridefinendola, c’è il sistema Frontier nel suo insieme. Questa macchina ha guadagnato il posto più alto nella lista TOP500 ed è stata comunque in grado di classificarsi al secondo posto della GREEN500. Questo sistema presenta un’efficienza energetica di 55,23 gigaflop/watt operando alla capacità standard di 1,102 Exaflop/s.

Al terzo posto troviamo LUMI, un bel risultato per il nuovo arrivato. Oltre ad essere il sistema più potente in Europa, LUMI ha anche un’impressionante valutazione di efficienza energetica, pari a 51,63 gigaflops/watt.

In effetti, LUMI fa parte di una tendenza più ampia nell’HPC che sta dimostrando che la potenza non deve essere sacrificata in nome dell’efficienza. Il posto n. 4 è occupato da Adastra, con un’efficienza di 50,03 gigaflops/watt.

Il vincitore del GREEN500 dello scorso anno è passato al quinto posto, poiché il sistema MN-3 di Preferred Networks in Giappone ha ora una valutazione di efficienza energetica di 40,90 gigaflops/watt.

Risultati HPL-AI

Il benchmark HPL-AI cerca di evidenziare la convergenza dei carichi di lavoro HPC e intelligenza artificiale (AI) basati su machine learning e deep learning, risolvendo un sistema di equazioni lineari utilizzando nuovi algoritmi a precisione mista che sfruttano l’hardware moderno.

Il sistema Frontier ha raggiunto un punteggio HPL-AI di 6,86 exaflop, superiore di tre volte al precedente benchmark di Fugaku di circa 2 exaflop. Fugaku è rimasto al primo posto negli ultimi due anni, ma le prestazioni di Frontier sembrano ora irraggiungibili.