Draco – benannt nach einem der sieben Wunder von Jena – ist ein Hochleistungsrechner, der allen Forschenden der Friedrich-Schiller-Universität Jena sowie anderer thüringischer Hochschulen zur Verfügung steht. Zusätzlich ist eine Nutzung für Lehrveranstaltungen möglich.
Der HPC-Cluster kann zur Durchführung rechenintensiver Simulationen in der wissenschaftlichen Forschung oder zur massiv-parallelen Verarbeitung und Analyse großer Datensätze genutzt werden. Zudem können Teile des Systems auch interaktiv genutzt werden. Mit seinen verteilten Rechenkapazitäten stellt Draco die Rechenressourcen bereit, um komplexe Berechnungen und Aufgaben mit hohem Durchsatz wie Data Mining oder Datenanalyse von mehreren Nutzern gleichzeitig ausführen zu lassen. Darüber hinaus ermöglicht die GPU-Partition von Draco die Durchführung von Aufgaben wie maschinelles Lernen oder Deep Learning.
Steckbrief
Rechenknoten des HPC-Cluster Draco
Foto: Andre Sternbeck (Universität Jena)Draco wurde im Juni 2021 in Betrieb genommen und seitdem jährlich erweitert. Aktuell umfasst das System folgende Komponenten:
Rechenknoten
Draco besitzt insgesamt 131 Rechenknoten mit
- 108 Standard-Rechenknoten mit meist 48 Rechenkernen und 256 GB Arbeitsspeicher pro Knoten,
- 5 HighMem-Rechenknoten mit extra großem Arbeitsspeicher von 2,3 bis 4 TB pro Knoten und
- 17 GPU-Rechenknoten mit zusätzlichen GPUs (Rechenbeschleuniger) vom Typ NVIDIA V100, A100 und H100.
Speichersysteme
Draco stellt verschiedene Speichersysteme für verschiedene Anwendungsprofile zur Verfügung:
- Performantes paralleles Dateisystem mit einer Kapazität von 520 TB.
- Hochperformantes All-Flash VASTDATA-Dateisystem mit einer Kapazität von 500 TB.
- Fünf NFS-Speichersysteme für die langfristige Ablage von großen Datenmengen durch Arbeitsgruppen
Netzwerk
Alle Rechenknoten und Speichersysteme sind durch ein latenzarmes Infiniband-Netzwerk mit einer Bandbreite von 100 bzw. 200 Gbps (HDR, HDR100) verbunden. Das Netzwerk besitzt eine Spine-Leaf-Topologie mit einem Blocking-Faktor von 2:1.
Sonstiges
- Auf dem Cluster ist das Betriebssystem AlmaLinux 8 installiert.
- Slurm kommt als Workloadmanager für die Verteilung der Rechenaufgaben auf den Cluster zum Einsatz.
- Zusätzliche Remote-Workstations für interaktive Anwendungen mit grafischer Oberfläche (Matlab, Mathematica, Lumerical, ...).
Hinweis: Ein Teil der Rechenknoten und Speichersysteme steht nur einzelnen Benutzergruppen zur Verfügung. Entsprechende Erweiterungen durch andere Forschungsgruppen oder temporäre Reservierungen von Ressourcen sind möglich.