Advanced Topics in High Performance Computing, Data Management and Analytics

  • Typ: Praktikum (P)
  • Lehrstuhl: Zentrale Einrichtungen - Steinbuch Centre for Computing
    KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Telematik - ITM Streit
  • Semester: SS 2021
  • Dozent: Prof. Dr. Achim Streit
    Dr. Nico Schlitter
  • SWS: 3
  • LVNr.: 2400068
  • Hinweis: Online
Inhalt

Die Praktikumsteilnehmer erhalten die Möglichkeit, Ihre Kenntnisse aus dem Bereichen Datenmanagement und Datenanalyse zu vertiefen und praxisnah einzusetzen. Die zu bearbeitenden Aufgaben stammen aus den Teilgebieten:

  • HPC Simulationen (z.B. Parallelisierung, MPI, Performance Engineering, etc.)
  • HPC Systeme und Betriebsumgebung (z.B. On Demand File Systems, Infiniband-Netzwerke, Job-Scheduling)
  • Maschinelles Lernen und Data Mining (z.B. RapidMiner, scikit)
  • Daten-Intensives Rechnen (z.B. Hadoop, Spark)
  • HPC und Datenanalyse mit Python (Numpy, Scipy, Pandas, Dask, Parsl)
  • Verteilte & Parallele Dateisysteme (z.B. glusterFS, BeeGFS)
  • Object Storage (z.B. S3, CEPH)
  • Datenmanagement System (z.B. dCache, iRods)
  • Datenbanken (SQL, NoSQL)
  • Workflowmanagementsysteme für HPC und Datenanalyse (FireWorks, AiiDA, SimStack)
  • Opportunistische Ressourceneinbindung und -nutzung (z.B. mittels COBalD/TARDIS)
  • Authentifizierungs- und Autorisierungs-Infrastruktur (z.B. OpenID, SAML)

Die Studierenden werden durch wissenschaftliche Mitarbeiter des Steinbuch Centre for Computing individuell betreut und können ihre Fähigkeiten durch Einbindung in aktuelle Forschungsaufgaben (z.B. Helmholtz-Programm, BMBF- und EU-Projekte) praxis- und forschungsnah einsetzen.

Themenvergabe und Planung der Präsenztermine erfolgt individuell zw. Praktikumsteilnehmer und Betreuer. Praktikumsteilnehmer bearbeiten separate Aufgabengebiete. Bei der Erstellung der Aufgabe werden eventuelle Vorkenntnisse und Interessensgebiete der Teilnehmer berücksichtigt.

Empfehlung: Grundkenntnisse in den Bereichen Datenbanken, Datenmanagement, Datenanalyse, Parallelrechner oder Parallelprogrammierung sind hilfreich.

Arbeitsaufwand: 12 h Präsenzzeit in Praktikumsbesprechungen, 18 h Vor-/Nachbereitung derselbigen, 120 h Bearbeitung des Themas und Erstellen der Prüfungsleistung

Anmeldeinformationen: Es steht eine begrenzte, kleine Zahl an Praktikumsplätzen zur Verfügung. Bitte bewerben Sie sich in Ilias (Link wird noch ergänzt) und schicken Ihren Lebenslauf und Notenauszug an Herrn Dr. Nico Schlitter (SCC, nico.schlitter@kit.edu) bis zum 05.04.2021 um 23:59:59.

Eine Einführungsveranstaltung, in der die Themen vorgestellt werden und es Möglichkeiten für Fragen gibt, wird stattfinden - der genaue Termin wird noch bekannt gegeben. Anschließend erfolgt die Themenvergabe.

VortragsspracheDeutsch/Englisch
Organisatorisches

nach Vereinbarung