Projektbezogenes Ressourcenmanagement des RWTH-Compute-Clusters

 

Das IT Center betreibt schon seit mehreren Jahrzehnten Hochleistungsrechner, die die Einrichtungen und Mitarbeitenden der RWTH Aachen University bei der Forschung und Lehre unterstützen. Alle Angehörige der RWTH Aachen haben freien Zugang zum RWTH Compute Cluster. Aber die Menge der Ressourcen, die sie nutzen können, ist begrenzt, u.a. bedingt durch eine Nachfrage, die in der Regel höher als das Angebot ist, und durch Auflagen der Fördergeldgeber.

Mit der Einrichtung der JARA-HPC Partition aus Anteilen Hoch- und Höchstleistungsrechner am FZ Jülich und an der RWTH Aachen wurde 2012 an der RWTH ein wissenschaftliches Vergabeverfahren für Rechenzeit etabliert. Die gemeinsame Vergabe in der JARA-HPC Partition sowie das 2014 eingeführte Vergabeverfahren für die alleine von der RWTH bewirtschafteten Anteile bestehen bis heute und folgen den Empfehlungen der Gauß-Allianz zur Etablierung national abgestimmter Beantragungs- und Bewilligungsverfahren. Der Gesamtprozess der Beantragung von Rechenzeit ist in Abb. 1 dargestellt.

 
  Schematische Darstellung des Bewirtschaftungsprozesses
 
 

Abbildung 1: Struktogramm des Beantragungs- und Bewilligungsprozesses von HPC-Ressourcen
Quelle: Empfehlung der Gauß-Allianz / s.o.

Der Umfang der beizubringenden Anträge und die Aufwände der Begutachtung, wie z.B. die Anzahl und Herkunft der einberufenen Gutachter, hängt vom Volumen der angeforderten Rechenzeit ab. Eine Übersicht über die verschiedenen Antragsschienen gibt die nachfolgende Tabelle, die genauen Rahmenbedingungen und Eigenschaften der unterschiedlichen Projekttypen sind in der technischen Dokumentation aufgeführt. In der Tabelle sind die entsprechende Phasen 2016 und 2018 von CLAIX als C-2016/C-2018 dargestellt.

 
  Tabellarische Darstellung der Antragsschienen

 
 

Die wichtigste Schiene ist JARA-HPC für große Rechenprojekte (derzeit ab 2,4 Mio. Core-h pro Jahr) von Wissenschaftlern aus Aachen und Jülich. Der Vergabeprozess für Rechenzeit von großen Projekten des FZJ und der RWTH wurde damit zusammengeführt und wird durch die Software JARDS unterstützt. Das integrierte Vergabeverfahren erleichtert es, den Anwendern die jeweils bestgeeignete Plattform, die durch zwischen dem FZJ und der RWTH zeitlich verschränkte Installationszeitpunkte aktuell gehalten wird, zugänglich zu machen.

Mit der Inbetriebnahme von CLAIX wurde die „BUND“-Schiene eingeführt und die gewünschte bundesweite Öffnung der Tier-2-Zentren realisiert. Darin kann jeder Wissenschaftler einer deutschen Forschungsorganisation einen Antrag stellen. Nach erfolgreicher Begutachtung erhält er über ein Coupon-Verfahren einen Account im IdM-System der RWTH und kann damit selbstständig weitere externe Personen zur Projektarbeit auf das System einladen.

Darüber hinaus werden auch kleine Rechenkontingente für Lehrveranstaltungen und Abschlussarbeiten unter Federführung der Dozenten bzw. Betreuer projektbezogen zugeteilt, so dass auch für diese Arbeiten zuverlässig Ressourcen auf dem Tier-3 System bereitgestellt werden können.

Die Zusammensetzung der Vergabegremien sowohl in JARA-HPC als auch für die Projekte an der RWTH repräsentieren die Nutzerschaft. Das bedeutet, dass das Vergabegremium aus Wissenschaftlern der auf den Systemen hauptsächlich vertretenen Fachrichtungen bestehen, und diese das Begutachtungsverfahren steuern.