Ressourcenmanagement im HPC via SLURM

Speakers:

David Neujahr (Fachinformatiker Systemintegration, Menzel IT )

Scheduled time: Saturday, 09:00 - Room V4 - Duration 60 Min.

Zum Stream

»Ich brauche sofort 100 CPUs für meinen Rechenjob!«
Zum Glück steht ein HPC-Cluster mit hunderten Servern und tausenden CPUs bereit.
Wie verwaltet man nun aber solche Mengen an Hardware-Ressourcen möglichst effizient und fair?
Dieser Vortrag behandelt genau diese Thematik im Zusammenhang mit dem Job-Organisator SLURM.

Folgende Schwerpunkte werden behandelt:

- Was ist Job-Scheduling und wann benötigen wir es?
- Warum SLURM ? Was sind die Alternativen ?
- Anwendungsbeispiele und Demonstrationen anhand einer fiktiven Universität

Desired previous knowledge: Unix-Grundkentnisse sind hilfreich

Video recording (external):

https://media.ccc.de/v/clt23-242-ressourcenmanagement-im-hpc-via-slurm