18.11.2021

Erfolgreiche Machine Learning Performance-Tests mit HoreKa

Forschende und Mitglieder der Helmholtz AI aus dem SCC und dem Jülich Supercomputing Center haben gemeinsam ihre Ergebnisse aus einer Wettbewerbsinitiative mit der HPC benchmarking-Software MLPerf™ zur Supercomputing-Konferenz 21 eingereicht.

HoreKa ist mit knapp 700 dieser GPU-Beschleuniger von NVIDIA ausgestattet und bestens für KI-Anwendungen gewappnet.

Helmholtz AI ist eine Kooperationsplattform, in der KI-Teams aus Deutschlands größten Forschungseinrichtungen zusammenarbeiten, um Wissenschaftlerinnen und Wissenschaftler anderer Fachrichtungen mit modernsten KI-Methoden zu unterstützen. Vor diesem Hintergrund haben Forschende und Mitglieder der Helmholtz AI aus dem SCC und dem JSC gemeinsam ihre Ergebnisse aus einer Wettbewerbsinitiative mit der HPC benchmarking-Software MLPerf™ zur Supercomputing-Konferenz 21 (SC21) eingereicht. Diese Initiative wurde 2020 von IT- und Softwarefirmen wie Baidu, Google und GraphCore sowie von Forschenden der Universitäten Stanford, Harvard und Berkeley ins Leben gerufen, um groß-skalige KI-Anwendungen intensiv zu untersuchen. Das KI-Team aus Jülicher und Karlsruher Forschenden entschied sich die Anwendung DeepCAM für KI-unterstützte Videolösungen und die Anwendung CosmoFlow, beide Deep-Learning-Anwendungen für neuronale Netzen zu untersuchen. Das Helmholtz AI-Team des SCC trainierte DeepCAM auf dem KIT-Supercomputer HoreKa unter Nutzung von 512 NVIDIA A100 GPUs und CosmoFlow zusätzlich auf dem Jülicher Superrechner JUWELS Booster.

DeepCAM, eine mit dem Gordon-Bell Preis 2019 ausgezeichnete Deep Learning KI-Software, ermöglicht es, Zyklone aus Klimaforschungsdaten zu erkennen. Das frühzeitige Aufspüren tropischer Wirbelstürme, die sich über dem Indischen und Südpazifischen Ozean bilden, ist entscheidend, um Menschenleben und Infrastruktur effektiv zu schützen sowie landwirtschaftlich nutzbare Trockengebiete zu bestimmen. Mit HoreKa konnte Daniel Coquelin im Team um Markus Götz die von DeepCAM geforderten mehr als 100 Billiarden Berechnungen in nur 4 Minuten und 21 Sekunden ausführen.

Bei allem Streben nach höherer Rechenleistung, ist es auch wichtig den klimaschädlichen Energieverbrauch solcher groß angelegter Messungen abzuwägen. Mit HoreKa und JUWELS, die auf der weltweiten Green500-Liste energieeffizienter Supercomputer unter den Top 15 rangieren, sind die Helmholtz AI-Rechenressourcen sowohl rechen- als auch sehr energieeffizient, was sie zu Europas schnellsten und umweltfreundlichsten Systemen für äußerst rechenintensive KI-Aufgaben macht. Die durchgeführten Benchmarks haben nicht nur geholfen, die aktuellen Systeme besser zu verstehen, sondern auch Wege für Verbesserungen zukünftiger Systeme aufgezeigt, denn die zur Verfügung gestellten Testwerkzeuge zeigen Administrierenden und Nutzenden gleichermaßen den CO2-Fußabdruck jedes einzelnen Rechenjobs auf.

Das KI-Team der Helmholtz-Plattform hofft auch im nächsten Jahr wieder Teil dieses herausfordernden und spannenden Wettbewerbs zu sein. Dabei wollen die HPC-Spezialistinnen und -Spezialisten nicht nur die im geschlossenen Modus des Wettbewerbs bestehenden, offiziellen Anwendungen im Ist-Zustand messen, sondern auch am sogenannten offenen Modus teilnehmen und dort einige fortgeschrittene, groß angelegte Trainingskonzepte präsentieren.

Weitere Informationen:

Kontakt am SCC: Markus Götz


Achim Grindler