Research

Topic of interest

My current research activities focus on job management on scheduling for HPC systems.

  • Ressource and Job Management System
  • Parallel Job Scheduling
  • Simulation and Modelisation
  • Reproducibility

Publications

The ability to reproduce an experiment is fundamen-tal in computer science. Existing approaches focus onrepeatability, but this is only the first step to repro-ducibility: Continuing a scientific work from a previ-ous experiment requires to be able to modify it. Thisability is called reproducibility with Variation.In this contribution, we show that capturing theenvironment of execution is necessary but not suffi-cient; we also need the environment of development.The variation also implies that those environmentsare subject to evolution, so the whole software devel-opment lifecycle needs to be considered. To take intoaccount these evolutions, software environments needto be clearly defined, reconstructible with variation,and easy to share. We propose to leverage functionalpackage managers to achieve this goal.

La diversité des plateformes de calcul à haute performance ne fait qu’augmenter. Le gestion-naire de ressources et de tâches (ou RJMS pourResources and Jobs Management Systems) est res-ponsable d’ordonnancer les tâches (applications souvent parallèles et distribuées) sur ce typede plateformes. Un ordonnancement mal maîtrisé peut dégrader significativement les perfor-mances des applications. Dans ce contexte, étudier et valider des RJMS ainsi que des algo-rithmes d’ordonnancement est un réel défi. Dans cet article nous présentons le logiciel Batsim,un simulateur d’infrastructure qui permet la simulation réaliste d’applications et l’étude deRJMS pour de nombreux problèmes. Nous validons notre approche en montrant que la priseen compte de la localité dans l’algorithme d’ordonnancement peut avoir un impact majeursur les applications. Ce phénomène, ainsi que de nombreux autres, ne peuvent être observésqu’avec des modèles d’applications (et de plateformes) sensibles au contexte d’exécution