Advanced Topics in High Performance Computing, Data Management and Analytics

  • Typ: Praktikum (P)
  • Lehrstuhl: Zentrale Einrichtungen - Scientific Computing Center
    KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Telematik - ITM Streit
  • Semester: SS 2023
  • Dozent: Prof. Dr. Achim Streit
    Dr. Nico Schlitter
  • SWS: 3
  • LVNr.: 2400068
Inhalt

Die Praktikumsteilnehmer erhalten die Möglichkeit, Ihre Kenntnisse aus dem Bereichen Datenmanagement und Datenanalyse zu vertiefen und praxisnah einzusetzen. Die zu bearbeitenden Aufgaben stammen aus den Teilgebieten:

  • HPC Simulationen (z.B. Parallelisierung, MPI, Performance Engineering, etc.)
  • HPC Systeme und Betriebsumgebung (z.B. On Demand File Systems, Infiniband-Netzwerke, Job-Scheduling)
  • Maschinelles Lernen und Data Mining (z.B. RapidMiner, scikit)
  • Daten-Intensives Rechnen (z.B. Hadoop, Spark)
  • HPC und Datenanalyse mit Python (Numpy, Scipy, Pandas, Dask, Parsl)
  • Verteilte & Parallele Dateisysteme (z.B. glusterFS, BeeGFS)
  • Object Storage (z.B. S3, CEPH)
  • Datenmanagement System (z.B. dCache, iRods)
  • Datenbanken (SQL, NoSQL)
  • Workflowmanagementsysteme für HPC und Datenanalyse (FireWorks, AiiDA, SimStack)
  • Opportunistische Ressourceneinbindung und -nutzung (z.B. mittels COBalD/TARDIS)
  • Authentifizierungs- und Autorisierungs-Infrastruktur (z.B. OpenID, SAML)

Die Studierenden werden durch wissenschaftliche Mitarbeiter des Scientific Computing Center individuell betreut und können ihre Fähigkeiten durch Einbindung in aktuelle Forschungsaufgaben (z.B. Helmholtz-Programm, BMBF- und EU-Projekte) praxis- und forschungsnah einsetzen.

Themenvergabe und Planung der Präsenztermine erfolgt individuell zw. Praktikumsteilnehmer und Betreuer. Praktikumsteilnehmer bearbeiten separate Aufgabengebiete. Bei der Erstellung der Aufgabe werden eventuelle Vorkenntnisse und Interessensgebiete der Teilnehmer berücksichtigt.

Empfehlung: Grundkenntnisse in den Bereichen Datenbanken, Datenmanagement, Datenanalyse, Parallelrechner oder Parallelprogrammierung sind hilfreich.

Arbeitsaufwand: 12 h Präsenzzeit in Praktikumsbesprechungen, 18 h Vor-/Nachbereitung derselbigen, 120 h Bearbeitung des Themas und Erstellen der Prüfungsleistung

Eine Einführungsveranstaltung, in der die Themen vorgestellt werden und es Möglichkeiten für Fragen gibt, wird in der 1. oder 2. Vorlesungswoche stattfinden - für weitere Details bitte im ILIAS-Kurs anmelden. In der Einführungsveranstaltung erfolgt die Themenvergabe.

VortragsspracheDeutsch/Englisch
Organisatorisches

nach Vereinbarung