Advanced Topics in High Performance Computing, Data Management and Analytics

  • type: Praktikum (P)
  • chair: Zentrale Einrichtungen - Scientific Computing Center
    KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Telematik - ITM Streit
  • semester: WS 23/24
  • lecturer: Dr. Mozhdeh Farhadi
    Prof. Dr. Achim Streit
  • sws: 3
  • lv-no.: 2400043
  • information: Online
Inhalt

Die Praktikumsteilnehmer erhalten die Möglichkeit, Ihre Kenntnisse aus dem Bereichen Hochleistungsrechnen, Datenmanagement und Datenanalyse zu vertiefen und praxisnah einzusetzen. Die zu bearbeitenden Aufgaben stammen aus den Teilgebieten:

  • HPC Simulationen (z.B. Parallelisierung, MPI, Performance Engineering, etc.)
  • HPC Systeme und Betriebsumgebung (z.B. On Demand File Systems, Infiniband-Netzwerke, Job-Scheduling)
  • Maschinelles Lernen und Data Mining (z.B. RapidMiner, scikit)
  • Daten-Intensives Rechnen (z.B. Hadoop, Spark)
  • HPC und Datenanalyse mit Python (Numpy, Scipy, Pandas, Dask, Parsl)
  • Verteilte & Parallele Dateisysteme (z.B. glusterFS, BeeGFS)
  • Object Storage (z.B. S3, CEPH)
  • Datenmanagement System (z.B. dCache, iRods)
  • Datenbanken (SQL, NoSQL)
  • Workflowmanagementsysteme für HPC und Datenanalyse (FireWorks, AiiDA, SimStack)
  • Opportunistische Ressourceneinbindung und -nutzung (z.B. mittels COBalD/TARDIS)
  • Authentifizierungs- und Autorisierungs-Infrastruktur (z.B. OpenID, SAML)

Die Studierenden werden durch wissenschaftliche Mitarbeiter des Scientific Computing Center individuell betreut und können ihre Fähigkeiten durch Einbindung in aktuelle Forschungsaufgaben (z.B. Helmholtz-Programm, BMBF- und EU-Projekte) praxis- und forschungsnah einsetzen.

Themenvergabe und Planung der Präsenztermine erfolgt individuell zw. Praktikumsteilnehmer und Betreuer. Praktikumsteilnehmer bearbeiten separate Aufgabengebiete. Bei der Erstellung der Aufgabe werden eventuelle Vorkenntnisse und Interessensgebiete der Teilnehmer berücksichtigt.

Empfehlung: Grundkenntnisse in den Bereichen Datenbanken, Datenmanagement, Datenanalyse, Parallelrechner oder Parallelprogrammierung sind hilfreich.

Arbeitsaufwand: 12 h Präsenzzeit in Praktikumsbesprechungen, 18 h Vor-/Nachbereitung derselbigen, 120 h Bearbeitung des Themas und Erstellen der Prüfungsleistung.

Eine Einführungsveranstaltung, in der die Themen vorgestellt werden und es Möglichkeiten für Fragen gibt, wird stattfinden - der genaue Termin wird noch bekannt gegeben. Anschließend erfolgt die Themenvergabe.

Die Erfolgskontrolle erfolgt in Form einer Prüfungsleistung anderer Art nach § 4 Abs. 2 Nr. 3 SPO. Die Prüfungsleistung kann aus Experimenten oder Projekten jeweils mit abschließendem Vortrag bestehen.

VortragsspracheDeutsch/Englisch
Organisatorisches

nach Vereinbarung