Karlsruhe - Das SCC hat den Pilotbetrieb des neuen Supercomputers „Hochleistungsrechner Karlsruhe“ - kurz HoreKa – aufgenommen. Während HoreKa in den nächsten Wochen auf seine volle Leistungsfähigkeit hochgefahren wird, beginnt damit nach fünfjährigem erfolgreichen Betrieb auch die Abschaltung des Vorgängers ForHLR II.
Bei seiner Inbetriebnahme im März 2016 gehörte der Forschungshochleistungsrechner II (ForHLR II) des KIT zu den wenigen Rechnern weltweit, die eine Rechenleistung von mehr als einem PetaFLOPS - also einer Billiarde Rechenoperationen pro Sekunde – erreichen konnten. Dafür waren damals mehr als 1150 Rechenknoten mit insgesamt fast 24.000 CPU-Kernen und 74 Terabyte Hauptspeicher nötig.
Aber nicht nur in Punkto Rechenleistung, sondern auch in einem anderen Bereich spielte das KIT mit dem ForHLR II ganz vorne mit: Das System wurde nicht mit kaltem, sondern mit bis zu 45 Grad heißem Wasser gekühlt. Damals nicht nur ein Novum in diesem Bereich, sondern auch der Grund für den Neubau eines Rechenzentrums für den Supercomputer am Campus Nord des KIT. Für das energieeffiziente Gesamtkonzept wurde dem SCC 2017 der Deutsche Rechenzentrumspreis verliehen.
Drei Jahre Vorarbeit für HoreKa
Die konkreten Planungen für ein Nachfolgesystem begannen bereits 2018. Im Jahr 2019 wurde das Projekt auf den Namen „Hochleistungsrechner Karlsruhe“ - kurz HoreKa - getauft und mit der Beschaffung begonnen. HoreKa wird allerdings nicht nur ein würdiger Nachfolger für den ForHLR II sein. Mit 769 Rechenknoten, fast 60.000 CPU-Kernen, mehr als 220 Terabyte Hauptspeicher und 668 GPUs wird das System eine theoretische Spitzenleistung von mehr als 17 PetaFLOPS erreichen und damit 17-mal so schnell sein wie der Vorgänger. Mitte 2021 soll HoreKa damit voraussichtlich zu den zehn schnellsten Rechnern Europas gehören.
Vor allem in den Materialwissenschaften, den Erdsystemwissenschaften, der Energie- und Mobilitätsforschung, im Ingenieurwesen sowie der Teilchen- und Astroteilchenphysik werden Forschende dank des neuen Supercomputers ein detaillierteres Verständnis hochkomplexer natürlicher und technischer Vorgänge erlangen können. Selbstverständlich kann HoreKa bei Bedarf auch von Wissenschaftlerinnen und Wissenschaftlern genutzt werden, die zum Verständnis des Virus SARS-CoV-2 forschen und damit zur Bekämpfung der Krankheit COVID-19 beitragen.
Rechnen und Speichern gehen Hand in Hand
Ein zentraler Gesichtspunkt bei der Auslegung des Systems waren auch die enormen Datenmengen, welche bei wissenschaftlichen Forschungsprojekten anfallen. Je nach Anwendung können von einer einzigen Simulation mehrere Hundert Terabyte erzeugt werden. Um mit den wachsenden Datenmengen Schritt zu halten, liefern die Rechenknoten, das InfiniBand-Netzwerk und die parallelen Dateisysteme von HoreKa im Vergleich zum Vorgängersystem ForHLR jeweils einen bis zu viermal höheren Durchsatz.
Eine mehrstufige Datenhaltung soll zusätzlich die schnelle Weiterverarbeitung auf externen Speichersystemen garantieren. HoreKa ist mit bis zu 45 GByte/s Datenrate an die „Large Scale Data Facility“ (LSDF) des SCC angebunden, die seit 2010 eine moderne Infrastruktur für die Speicherung, Verwaltung, Archivierung und Analyse von Forschungsdaten bietet.
Vollbetrieb von HoreKa beginnt zum 1. Juni
HoreKa wurde in den letzten Monaten direkt neben dem ForHLR II aufgebaut und in Betrieb genommen. Erste Nutzergruppen haben bereits Zugriff erhalten, um ihre Anwendungen anpassen und optimieren zu können. In den nächsten Wochen wird das System auf seine volle Leistungsfähigkeit hochgefahren und der Pilotbetrieb nahtlos in einen Vollbetrieb übergehen. Ab dem 1. Juni 2021 soll HoreKa dann Wissenschaftlerinnen und Wissenschaftlern aus ganz Deutschland zur Verfügung stehen. Anträge auf Rechenzeit können bereits jetzt gestellt werden.
Da das Rechenzentrum am Campus Nord nicht beide Systeme gleichzeitig versorgen kann, muss der ForHLR II parallel stufenweise zurückgebaut werden. Bis Mitte April wird das System dann vollständig abgeschaltet sein und nicht mehr zur Verfügung stehen. Die Bilanz des fünfjährigen Betriebs fällt äußerst positiv aus: Mehr als 140 verschiedenen Forschungsprojekten konnte insgesamt fast eine Milliarde CPU-Stunden Rechenzeit zur Verfügung gestellt werden.
Mehr Informationen zu HoreKa und zur Antragsstellung für das neue System: www.nhr.kit.edu/userdocs/horeka/
Mehr Information zu COVID-19-Forschung am KIT:
- www.kit.edu/kit/corona-pandemie-forschung-und-hilfsaktivitaeten-am-kit.php
- www.scc.kit.edu/ueberuns/13531.php
Mit dem bwUniCluster 2.0 betreibt das KIT einen zweiten Supercomputer im Landesdienst: www.scc.kit.edu/dienste/bwUniCluster_2.0.php
Jennifer Buchmüller
Simon Raffeiner