bwUniCluster 3.0
Am 7. April 2025 ging das neue Parallelrechnersystem „bwUniCluster 3.0+KIT-GFA-HPC 3“ (auch bwUniCluster 3.0 genannt) im Rahmen des baden-württembergischen Umsetzungskonzepts für Hochleistungsrechnen (bwHPC) als Landesdienst in Betrieb.
Das HPC-System besteht aus mehr als 370 SMP-Knoten mit 64-Bit-Prozessoren von AMD und Intel. Es stellt den Hochschulen des Landes eine Grundrechenleistung zur Verfügung und kann von den Mitarbeitenden aller baden-württembergischen Hochschulen kostenlos genutzt werden.
Jede Landesuniversität regelt die Zugangsberechtigung zu diesem System für ihre Mitarbeitenden selbst. Nutzerinnen und Nutzer, die bereits einen Zugang zum bwUniCluster 2.0 haben, erhalten automatisch einen Zugang zum bwUniCluster 3.0. Sie müssen sich lediglich unter https://bwidm.scc.kit.edu für diesen Service registrieren. Weitere Details zur Registrierung und zum Zugang zu diesem nationalen Dienst finden Sie unter https://wiki.bwhpc.de/e/BwUniCluster3.0.
Das neue HPC-System bwUniCluster 3.0
Der bwUniCluster 3.0 ist ein massiver Parallelrechner mit insgesamt mehr als 370 Knotenpunkten. Davon entfallen rund 90 Knoten auf die am KIT-Campus Nord betriebenen neuen Komponenten, die dank ihrer Warmwasserkühlung ressourceneffizienter betrieben werden können und auch zur Beheizung der umliegenden Bürogebäude beitragen.
Rund 280 Knoten stammen aus dem Ausbau des bwUniCluster 2.0 ab 2022 und werden weiterhin am KIT-Campus Süd betrieben.
Insgesamt ist das System kleiner als sein direkter Vorgänger, die Rechenleistung steigt jedoch durch deutlich leistungsfähigere Hardware, während gleichzeitig der Stromverbrauch sinkt.
Das Basis-Betriebssystem auf jedem Knoten ist Red Hat Enterprise Linux (RHEL) 9.x. Die Management-Software für den Cluster ist KITE, eine am SCC entwickelte Softwareumgebung für den Betrieb von heterogenen Computing-Clustern.
Als globales Dateisystem ist das skalierbare, parallele Lustre-Dateisystem über ein eigenes InfiniBand-Netzwerk angebunden. Der Einsatz von mehreren Lustre Object Storage Target (OST) Servern und Meta Data Servern (MDS) gewährleistet sowohl eine hohe Skalierbarkeit als auch Redundanz bei Ausfall einzelner Server.