Enjeux de reproductibilité expérimentale
Orateur: A. Legrand
Résumé: Les problématiques de reproductibilité de la recherche traversent l'ensemble des domaines de la science (oncologie, neuro-psychologie, économie, biologie computationelle, chimie, informatique, mathématiques) mais se déclinent de façon très différentes d'une discipline à l'autre. Par le biais de mon expérience de validation de SimGrid à l'aide de Grid5000, je présenterai quels me semblent être les enjeux à relever qui sont propres à notre discipline.
Bio: Arnaud Legrand est Directeur de Recherche CNRS à l'Université de Grenoble et responsable de l'équipe Inria POLARIS. Ses recherches portent sur l'évaluation et l'optimisation de performance dans le cadre du calcul scientifique (HPC, cloud, calcul bénévole, etc.). Il est l'un des membres fondateurs du projet logiciel SimGrid qui permet d'étudier et de prédire la performance de systèmes de calculs parallèles et distribués. Il s'intéresse depuis plus de 10 ans aux problématiques de science ouverte et en particulier aux enjeux socio-techniques de reproductibilité de la recherche. Il a co-réalisé le MOOC « Recherche reproductible : principes méthodologiques pour une science transparente » dont la 3ème édition compte déjà plus de 15000 participants.
Grid’5000 : Ajouter la méthode expérimentale a la science de l’informatique distribuée
Orateurs: F. Cappello, M. Cosnard, Y. Robert
Résumé: Pour comprendre la nécessité de Grid’5000, il faut remonter au tout début de ce siècle. A cette époque (Pulp fiction sortait sur grand écran et il faudra attendre encore plusieurs années avant de voir les premiers iPhones), la recherche pour les systèmes parallèles et distribués était essentiellement concentrée sur les clusters de PC. Le terme Grid devenait populaire et L’ACI Grid était lancée par Michel Cosnard en 2001 avec le but de développer des algorithmes et des prototypes de logiciels pour la globalisation (aux niveaux régional, national et même international) des ressources et des données informatiques. Les premiers projets financés commençaient leur travaux avec la nécessité d’expérimentation à grande échelle pour démontrer les avancées théoriques et techniques. En France, il s’agissait de pouvoir lancer des expériences sur plusieurs sites géographiquement distribués. Rapidement est survenu un problème insurmontable avec les moyens de l’époque : il n’était pas possible de respecter les notions mêmes de contrôle, mesure et reproductibilité d’expériences qui sont fondamentales dans la méthode scientifique et dont la commuté du calcul parallèle et distribuée était habituée. L’idée de Grid5000 est née pour répondre à ce défi. Dans cette présentation nous couvrirons les réflexions et décisions initiales qui ont permis la proposition puis l’existence de Grid5000. Avec le recul, on peut s’apercevoir que bien qu’étant créé pour supporter la recherche, Grid’5000 était lui-même une grande aventure de recherche qui a et qui continue 20 ans après à fédérer de nombreuses équipes de recherche.
Bio: Cappello received his Ph.D. from the University of Paris XI in 1994 and joined CNRS, the French National Center for Scientific Research. In 2003, he joined INRIA, where he held the position of permanent senior researcher. He initiated the Grid’5000 project in 2003 and served as its director from 2003 to 2008. In 2009, Cappello created with Marc Snir the Joint-Laboratory on Petascale Computing that has developed in 2014 as the Joint laboratory on Extreme Scale Computing (JLESC) gathering seven of the most prominent research and production centers in supercomputing: NCSA, Inria, ANL, BSC, JSC, Riken CCS and UTK/ICL. From 2008, as a member of the executive committee of the International Exascale Software Project, he led the roadmap and strategy efforts related to Exascale resilience. In 2016 Cappello became the lead of two Exascale Computing Project (ECP: https://www.exascaleproject.org/) software projects related to resilience and lossy compression of scientific data. Through his 25 years of research career, Cappello co-authored more than 250 publications and directed the development of several high-impact software tools, including XtremWeb, one of the first Desktop Grid softwares, the VeloC multilevel checkpointing environment, and the SZ lossy compressor for scientific data. He is an IEEE Fellow, the recipient of the 2022 HPDC Achievement Award, two R&D100 awards (2019 and 2021), the 2018 IEEE TCPP Outstanding Service Award, and of the 2021 IEEE Transactions of Computer Award for Editorial Service and Excellence.
Aladdin a-t-il maîtrisé GENI ?
Orateurs: D. Margery, F. Desprez, L. Nussbaum
Résumé: Grid'5000 a été lancé comme une grille, où chaque site avait son propre domaine d'administration. Il a réussi dans la durée en appliquant une des recettes du cloud : il y a 1 domaine d'administration unique pour l'offre de service offerte aux utilisateurs, et une seule pile logicielle pour exploiter tous les sites. Nous reviendrons sur la façon dont ce changement a été mis en place, et sur ses conséquences pour les responsables de sites comme pour l'équipe technique, ainsi que sur les défis en France et à l'Europe pour faire comprendre ce qu'était Grid'5000.
Bio: Recruté en 2004 en tant qu'ingénieur de recherche à l'INRIA, David Margery a rapidement travaillé pour la moitié de son temps à l'administration du site rennais de Grid'5000, alors que de l'autre, il lançait le service de forge pour tout INRIA, tout en maintenant un service de wiki pour les équipes de l'IRISA. En 2007, il est chargé de préparer la suite du projet ayant lancé Grid'5000, en créant la fonction de directeur technique. Depuis 2016, David Margery travaille sur la question de la pérennisation des logiciels issus de l’activité de recherche d’Inria et de ses partenaires, lorsque ces logiciels ont trouvé des utilisateurs en dehors des cercles académiques. Depuis 2018, il est responsable du programme InriaSoft, qui vise à augmenter l’impact économique des logiciels open source issus de l’activité d’Inria.
Évolution du matériel et des services logiciels disponibles dans Grid'5000
Orateurs: S. Delamare et P. Neyron avec la participation de D. Margery et L. Nussbaum
Résumé: Cet exposé retrace l'évolution de l'offre de service de Grid'5000 au cours de ses 20 ans d'existence. Les différentes générations de matériel disponibles seront passées en revues et l'historique des services logiciels proposés aux utilisateurs sera également abordé. La présentation donnera l'occasion de rappeler les services proposés par Grid'5000 ayant connus de grands succès... mais également ceux pour lesquels cela n'a pas aussi bien marché !
Bio Simon: Simon Delamare est ingénieur de recherche CNRS et travaille au Laboratoire de l'Informatique du Parallélisme hébergé à l'ENS Lyon depuis 2012. Il est titulaire d'un doctorat en informatique dans le domaine des systèmes distribués et réseaux à Telecom ParisTech. Simon Delamare participe aux activités de recherche en calcul haute performance et distribué et en intelligence artificielle effectuées au sein du laboratoire, ainsi qu'au développement des infrastructures liées à ces thématiques. À ce titre, il est impliqué dans la plate-forme d'expérimentation Grid'5000 et en a notamment été le directeur technique en 2021 et 2022.
Bio Pierre: Pierre Neyron est ingénieur de recherche CNRS au Laboratoire d'Informatique de Grenoble depuis 2011, spécialiste de l’informatique des datacentres : infrastructures logicielles et matérielles pour le BigData, le Cloud, le calcul intensif et l’intelligence artificielle. Il est ingénieur de Telecom Nancy. Sa contribution à Grid'5000 débute en 2005, alors recruté par Inria comme directeur technique. Plus récemment, il était en charge du pilotage des développements pour la plateforme.
La place du HPC comme un moteur de Grid’5000
Orateur: O. Richard, P. Neyron
Résumé: La place du HPC dans l'aventure Grid'5000 est particulière, à la fois dans sa genèse, comme domaine d'étude, source de collaborations, d'inspirations et limites à ne raisonnablement pas dépasser. Dans cet exposé nous présenterons des illustrations de ces différentes facettes et discuterons des questionnements en cours.
Bio Olivier : Olivier Richard est enseignant-chercheur à l'Université Grenoble Alpes. Il s'intéresse à la gestion de tâches et ressources dans les infrastructures notamment de type HPC et Cloud. Cela l'a amené à s'interroger sur la problématique des expérimentations des systèmes distribués et à contribuer aux développements de plate-formes, d'outils et de méthodologies dédiés à la conduites d'expériences.
Bio Pierre: Pierre Neyron est ingénieur de recherche CNRS au Laboratoire d'Informatique de Grenoble depuis 2011, spécialiste de l’informatique des datacentres : infrastructures logicielles et matérielles pour le BigData, le Cloud, le calcul intensif et l’intelligence artificielle. Il est ingénieur de Telecom Nancy. Sa contribution à Grid'5000 débute en 2005, alors recruté par Inria comme directeur technique. Plus récemment, il était en charge du pilotage des développements pour la plateforme.
Grid’5000 et les défis des traitements intensifs de données à très grande échelle
Orateur: G. Antoniu
Résumé: Cet exposé revient sur des expériences réalisées durant ces dernières 20 années sur la plate-forme Grid’5000 et fait un bilan des avancées permises par ces expériences dans le domaine du traitement de données pour des applications s’exécutant sur de très grandes infrastructures (supercalculateurs, clouds, edge). Il discutera également de futures directions possibles où l’expérimentation à grande échelle sera déterminante, dans le contexte de l’émergence du continuum edge-cloud-HPC.
Bio: Gabriel Antoniu est Directeur de Recherche chez Inria à Rennes, où il dirige l'équipe de recherche KerData. Ses recherches les architectures de stockage, d’entrées/sorties et de traitement de données à très grande échelle, favorisant la convergence du HPC, de l'analytique Big Data et de l'IA. Il a obtenu son doctorat en informatique en 2001 à l'ENS Lyon et son habilitation à diriger des recherches en 2009 à l'ENS Cahan/Bretagne. Il a coordonné plusieurs projets internationaux dans ces domaines en partenariat avec Microsoft Research, Argonne National Lab, l'Université de l'Illinois à Urbana Champaign, Universidad Politécnica de Madrid, Barcelona Supercomputing Center et des entreprises comme IBM, ATOS, Total. Il a présidé le comité de programme de la conférence IEEE Cluster en 2014 et 2017 et siège régulièrement en tant que membre dans des comités de programme de conférences majeures dans le domaine du HPC, du cloud computing et de l'analyse des données massives (notamment SC, HPDC, CCGRID, Cluster, Big Data). Il a dirigé plus de 20 thèses de doctorat et a co-écrit plus de 150 publications internationales dans les domaines susmentionnés.
Grid'5000, l'importance du nom : retour sur 15 ans d'expériences autour des clouds
Orateur: A. Lebre
Résumé: 4 jours après la fin de la première édition de l’école Grid’5000 en 2006, Amazon propose officiellement AWS et notamment le service EC2 qui permet de provisionner à la demande des machines virtuelles, démocratisant ainsi le service de calcul à la demande. Coïncidence ? faut il renommer la plateforme Grid’5000 ? Si la question a été réellement posée pour notamment enlever l’ambiguité qui a pu faire défaut à certains auteurs lors des premiers expériences, Grid’5000 s’est rapidement imposé comme la plateforme de choix pour réaliser des expériences sur les défis associés à ce nouveau paradigme de Cloud Computing. Dans cette présentation, nous reprendrons les principaux travaux qui ont été conduits depuis 2008 et qui ont donné lieu aujourd’hui à une reconnaissance internationale de l’outil aussi bien dans la communauté scientifique que dans les principales initiatives open-source. Nous verrons également comment ces travaux ont donné lieu à des bibliothèques pour la conduite d’expériences à large échelle et notamment la solution enosLib.
Bio: Adrien Lebre est professeur à IMT Atlantique (France) et dirige le groupe de recherche STACK, qui traite des défis liés à la gestion et aux usages avancés des infrastructures numériques (i.e. Cloud, Fog, Edge, et au-delà). Adrien Lebre est titulaire d'un doctorat de l'Institut des technologies de Grenoble et d'une habilitation de l'Université de Nantes. Ses activités portent sur les systèmes distribués à grande échelle, leur conception, leurs propriétés de composition et leur implémentation efficace. Depuis 2015, ses activités se concentrent principalement sur le paradigme de l'Edge Computing, en particulier dans les écosystèmes OpenStack, et plus récemment, Kubernetes. Adrien Lebre est également fortement impliqué dans plusieurs initiatives liées à la recherche expérimentale sur les infrastructures numériques (Silecs/Slices). Pour plus d'informations, veuillez consulter : http://stack.imt-atlantique.fr/alebre.html
Grid’5000 : une plate-forme unique pour mesurer l’énergie
Orateurs: L. Lefèvre
Résumé: La mesure de la consommation énergétique et de l'impact environnemental du numérique est un challenge auquel se confrontent divers acteurs. Cette mesure souvent associée à des estimations d'impacts permet de s'engager sur une analyse fine et une meilleure compréhension des couts associés aux usages de services numériques. Elle doit s'accompagner d'autres approches permettant d'analyser les impacts environnementaux du numérique. Mais ce n'est que la première étape du long chemin vers un numérique plus responsable et sobre. Comment intégrer ces mesures et les utiliser pour réduire les impacts du numérique ? Grid’5000 est un outil unique de mesure de consommation électrique des ressources de systèmes distribués. Nous explorerons ainsi comment l’usage d’une telle plate-forme instrumentée est une étape incontournable à une recherche expérimentale impactante.
Bio: Laurent Lefevre est chercheur Inria dans l'équipe Avalon du laboratoire LIP (ENS Lyon). Il explore depuis plus d’une quinzaine d'années le thème de l'efficacité énergétique des grands systèmes numériques et plus généralement de l'impact environnemental des technologies de l'information et de la communication. Il utilise et enrichiet la plate-forme Grid’5000 depuis 16 ans afin d’expérimenter et valider les modèles et algorithmes d’améliorations d’efficacité énergtique.
Dépasser les limites de Grid’5000 : interconnexions vers l’étranger et expériences à très large échelle
Orateurs: TBD
Résumé: Au fil des ans, Grid’5000 a été utilisé dans le cadre de divers travaux sortant du cadre habituel de son utilisation. Dans cette présentation, nous reviendrons sur les diverses interconnexions avec l’étranger (Japon, Brésil, Luxembourg, ...), avec des réseaux de plateformes européens (BonFIRE, Fed4FIRE), et les initiative ponctuelles d’interconnexion dimensionnantes (Plugtest). Nous évoquerons également les expériences hors des domaines de recherche traditionnels de Grid’5000 qui se sont appuyées sur Grid’5000 : cryptographie, apprentissage, etc.
Bio:
De Grid’5000 à Chameleon : retour sur dix années de testbed
Orateur: Pierre Riteau, Principal Engineer, StackHPC Ltd
Résumé : L'un des aspects étudiés pendant mon doctorat (2008-2011) était le Sky Computing : créer des plateformes de calcul largement distribuées en fédérant de nombreuses infrastructures de cloud. Je reviendrai sur ces expériences qui m'ont amené à déployer des clouds à large échelle sur Grid'5000 et à en fédérer les ressources avec celles du testbed FutureGrid aux État-Unis. Quelques années plus tard, j'ai participé à la création du testbed Chameleon (NSF). Je reviendrai sur sa conception et comment Grid'5000 a fortement inspiré son architecture et même participé à sa mise en œuvre.
Bio: Pierre Riteau est actuellement Principal Engineer à StackHPC, où il aide à concevoir, déployer et maintenir OpenStack pour de nombreuses organisations dans le domaine scientifique. Il est activement impliqué dans la communauté OpenStack : Project Team Lead (PTL) de Blazar, le service de réservation de OpenStack, et core reviewer pour Kayobe (déploiement automatisé d'OpenStack) et CloudKitty (suivi du coût d'utilisation des ressources OpenStack). Il a été Lead DevOps Engineer pour Chameleon, un testbed reconfigurable pour les expériences à large échelle dans le domaine du cloud computing. Il a obtenu son doctorat en informatique de l'Université de Rennes 1 en 2011.
Lessons learned, ou « ce qui a moins bien marché, et ce qu’on peut en tirer »
Orateurs: L. Nussbaum, D. Margery, O. Richard, S. Delamare
Résumé: Une célèbre devise des Shadocks est « Ce n'est qu'en essayant continuellement que l'on finit par réussir. Autrement dit: plus ça rate, plus on a de chances que ça marche. » La vie de Grid’5000 n’a pas été un long fleuve tranquille. Dans cette présentation, nous reviendrons sur ce qui a été vraiment difficile, ce qui a moins bien marché, et sur les leçons que nous pouvons tirer de cette expérience pour l’avenir.
Bio: Lucas Nussbaum et maître de conférences à l’Université de Lorraine. Il est actuellement en détachement à l’Inria, au Service du Développement Technologique de la DGD-I, où il cordonne les activités de l’institut sur les plateformes d’expérimentation et les moyens de calcul. Impliqué à des titres divers dans Grid’5000 depuis 2005, il en a été le directeur technique de 2017 à 2020.
SLICES: De l’IoT au datacenter, expérimenter sur toute la chaîne de la donnée
Orateurs: N. Mitton, C. Perez
Résumé: En se basant sur l'expérience acquise en particulier avec Grid'5000 et l'EquipEx FIT, la plateforme SLICES-RI vise à permettre des expérimentations sur le continuum complet depuis l'IoT aux centres de données.
Bio Nathalie: Nathalie Mitton, directrice de recherche Inria a obtenu sa thèse de l'INSA de Lyon en 2006 resp et son HDR en 2011 à l'Université Lille 1. Depuis 2012, elle est la responsable scientifique de l'équipe FUN d'Inria. Ses intérêts de recherche portent sur l'auto-organisation des réseaux sans fil contraints, dynamiques et mobiles. Elle a participé à la mise en place de l’equipEx FIT et est co-responsable de la mise en place de la plateforme ESFRI SLICES-RI (coordinatrice du projet Horizon Europe SLICES-PP) et de la création du noeud français SLICES-FR.
Bio Christian Christian Perez, directeur de recherche Inria, a obtenu son doctorat à l'ENS Lyon en 1999, et son habilitation à diriger des recherches en 2006 à l'Université de Rennes I. Depuis 2012, il dirige l'équipe de recherche commune Inria-CNRS-ENS Lyon-Univ. LyonI AVALON dont l'objectif est d'améliorer l'exécution des applications parallèles et/ou distribuées sur des ressources parallèles et/ou distribuées telles que les clouds ou les supercalculateurs. Il est membre du bureau exécutif de Grid'5000 depuis 2012 et participe à la création du futur GIS SLICES-FR. Il co-pilote la participation de la France à l'infrastructure de recherche européenne SLICES, labellisée par ESFRI en 2021.