Ressourcenmanagement im HPC via SLURM

Referierende:

David Neujahr (Fachinformatiker Systemintegration, Menzel IT )

Termin: Samstag, 09:00 - Raum V4 - Dauer 60 Min.

Zum Stream

»Ich brauche sofort 100 CPUs für meinen Rechenjob!«
Zum Glück steht ein HPC-Cluster mit hunderten Servern und tausenden CPUs bereit.
Wie verwaltet man nun aber solche Mengen an Hardware-Ressourcen möglichst effizient und fair?
Dieser Vortrag behandelt genau diese Thematik im Zusammenhang mit dem Job-Organisator SLURM.

Folgende Schwerpunkte werden behandelt:

- Was ist Job-Scheduling und wann benötigen wir es?
- Warum SLURM ? Was sind die Alternativen ?
- Anwendungsbeispiele und Demonstrationen anhand einer fiktiven Universität

Erwünschte Vorkenntnisse: Unix-Grundkentnisse sind hilfreich

Video-Aufzeichnung (extern):

https://media.ccc.de/v/clt23-242-ressourcenmanagement-im-hpc-via-slurm