Continuità dei servizi per i sistemi HPC
Problemi di raffreddamento nei sistemi HPC
La continuità dei servizi per i sistemi HPC è il risultato diretto del grado di ridondanza garantito in ciascuna catena tecnica: alimentazione elettrica e raffreddamento. È necessario distinguere la disponibilità dei sistemi di calcolo dalla sicurezza dei dati (assenza di perdite) trattati dall'HPC.
La conseguenza di questi due punti precedenti è che un sistema HPC dispone solitamente di diversi livelli di ridondanza, a seconda della componente del sistema: nodi di servizio per l'HPC, archiviazione dei dati provenienti dall'HPC, elaborazione HPC. I primi due elementi sono generalmente meglio protetti (alimentazione sicura di alta qualità e raffreddamento).
Il principale ostacolo alla disponibilità estremamente elevata dei sistemi HPC riguarda il loro raffreddamento, e in particolare il trattamento termico finale (all'interno dell'armadio).
I sistemi HPC diventano sempre più potenti e i costi dell'energia elettrica sono destinati ad aumentare. È quindi necessario puntare alla massima efficienza possibile. Ciò comporta l'eliminazione, per quanto possibile, del funzionamento in modalità compressore nel trattamento termico (produzione di freddo).
In un sistema tradizionale, è quindi necessario aumentare la temperatura dell'acqua che convoglia il calore fuori dai rack (componenti attivi delle reti, server, dispositivi di archiviazione).
Questa ricerca dell'efficienza deve procedere di pari passo con il forte aumento della densità di potenza per U (utilizzo della GPU, tipologia di CPU, numero di CPU e GPU per U) nei sistemi HPC.
La modalità di raffreddamento «tutto aria» diventa difficile da mantenere con potenze superiori a 25 kW per rack.-
Quale soluzione adottare per ovviare a questa mancanza di raffreddamento?
Per rispondere a questi diversi punti: vengono adottate alcune alternative al sistema di ventilazione a pavimento tecnico e ai moduli di climatizzazione tra i rack, quali la porta fredda, il DLC (Direct Liquid Cooling) e l'immersione. Tutte queste tecnologie non sono nuove, ma l'elevata capacità che offrono compensa ormai i limiti che comportano (gestione, sicurezza, disponibilità).
La continuità operativa dei sistemi HPC dipende quindi dalla scelta del miglior compromesso tra capacità, sicurezza dei dati e prestazioni. Le tecnologie di raffreddamento adottate sono fondamentali per raggiungere questo equilibrio.

Costruisci il tuo data center in container
Poiché il vostro futuro data center deve adattarsi al vostro tipo di attività e alle vostre esigenze in termini di scalabilità, Module-it ha sviluppato un configuratore dinamico che vi permette di ottenere in un minuto il data center più adatto alle vostre esigenze.