Ressourcenmanagement im HPC via SLURM
Referierende:
David Neujahr (Fachinformatiker Systemintegration, Menzel IT )
Termin: Samstag, 09:00 - Raum V4 - Dauer 60 Min.
Zum Stream
»Ich brauche sofort 100 CPUs für meinen Rechenjob!«
Zum Glück steht ein HPC-Cluster mit hunderten Servern und tausenden CPUs bereit.
Wie verwaltet man nun aber solche Mengen an Hardware-Ressourcen möglichst effizient und fair?
Dieser Vortrag behandelt genau diese Thematik im Zusammenhang mit dem Job-Organisator SLURM.
Folgende Schwerpunkte werden behandelt:
- Was ist Job-Scheduling und wann benötigen wir es?
- Warum SLURM ? Was sind die Alternativen ?
- Anwendungsbeispiele und Demonstrationen anhand einer fiktiven Universität
Erwünschte Vorkenntnisse: Unix-Grundkentnisse sind hilfreich
https://media.ccc.de/v/clt23-242-ressourcenmanagement-im-hpc-via-slurm