Continuité de services pour les systèmes HPC

Problème de refroidissement avec les systèmes HPC

La continuité de services pour les systèmes HPC est la directe résultante du degré de redondance apportée à chaque chaine technique : alimentation électrique et refroidissement. Il faut dissocier la disponibilité des systèmes de calcul, de la sécurisation des données (pas de pertes) traitées par le HPC.

La conséquence de ces deux points précédents est qu’un système HPC bénéficie le plus souvent de différents niveaux de redondance, en fonction de la partie du système : nœuds de services pour le HPC, stockage de données issues du HPC, calcul HPC. Les deux premières briques sont généralement mieux servies (alimentation sécurisée HQ et cooling).

La contrainte principale qui pèse sur la très haute disponibilité des systèmes HPC concerne le refroidissement de ces systèmes – et particulièrement le traitement calorifique terminal (dans la baie).

Les systèmes HPC sont de plus en plus puissants et les coûts électriques ne cesseront d’augmenter. Il faut donc chercher le meilleur rendement possible. Cela passe par l’élimination, au maximum, du mode compresseur dans le traitement calorifique (production de froid).

Sur un système traditionnel, il faut donc augmenter les températures d’eau qui véhiculeront les calories en dehors des baies (éléments actifs de réseaux, serveurs, stockage).

Cette recherche du rendement doit se mener en parallèle de la très forte augmentation de la densité électrique au U (utilisation du GPU, typologie de CPU, nombre de CPU et GPU au U) des systèmes HPC.

Le mode de refroidissement en « tout air » devient difficile à conserver sur des densités supérieures à 25 kW/baie.-

Configurez votre propre datacenter en container

Concevoir son datacenter n’a jamais été aussi facile !
Visualisez en temps réel et dans un rendu 3D réaliste, vos choix en terme de capacité, de densité et d’options.
Une fois votre conception finalisée, obtenez sa fiche technique détaillée et le budget associé.

Quelle solution appliquer pour compenser ce manque de refroidissement ?

Pour répondre à ces différents points : des méthodes alternatives au soufflage en plancher technique et aux modules de climatisations inter-baies : la porte froide, le DLC (direct liquid cooling) et l’immersion sont mises en œuvre. Toutes ces technologies sont anciennes mais la forte capacité qu’elles donnent compensent désormais les contraintes qu’elles apportent (exploitation, sécurité, disponibilité)

La continuité de service des systèmes HPC passe donc par le choix du meilleur compromis entre la capacité, la sécurité des données et le rendement. Les technologies de refroidissement adoptées sont au cœur de cet équilibre à trouver.

Des experts mobilisés pour vos projets de datacenter
Avantages des datacenters en container Création d’une salle informatique dans un local existant GTC vs DCIM – La supervision des Datacenters ICPE et Data Center Efficacité énergétique dans les Datacenters Sécurité physique, sécurité incendie