Research

Topic of interest

My current research activities focus on job management on scheduling for HPC systems.

  • Resources and Job Management System
  • Parallel Job Scheduling
  • Simulation and Modelisation
  • Reproducibility

Publications

The ability to reproduce an experiment is fundamental in computer science. Existing approaches focus on repeatability, but this is only the first step to reproducibility: Continuing a scientific work from a previous experiment requires to be able to modify it. This ability is called reproducibility with Variation.In this contribution, we show that capturing the environment of execution is necessary but not sufficient; we also need the environment of development.The variation also implies that those environments are subject to evolution, so the whole software development lifecycle needs to be considered. To take into account these evolutions, software environments need to be clearly defined, reconstructible with variation,and easy to share. We propose to leverage functional package managers to achieve this goal.

La diversité des plateformes de calcul à haute performance ne fait qu’augmenter. Le gestion-naire de ressources et de tâches (ou RJMS pourResources and Jobs Management Systems) est res-ponsable d’ordonnancer les tâches (applications souvent parallèles et distribuées) sur ce typede plateformes. Un ordonnancement mal maîtrisé peut dégrader significativement les perfor-mances des applications. Dans ce contexte, étudier et valider des RJMS ainsi que des algo-rithmes d’ordonnancement est un réel défi. Dans cet article nous présentons le logiciel Batsim,un simulateur d’infrastructure qui permet la simulation réaliste d’applications et l’étude deRJMS pour de nombreux problèmes. Nous validons notre approche en montrant que la priseen compte de la localité dans l’algorithme d’ordonnancement peut avoir un impact majeursur les applications. Ce phénomène, ainsi que de nombreux autres, ne peuvent être observésqu’avec des modèles d’applications (et de plateformes) sensibles au contexte d’exécution