Le consortium e-COL+ coordonné par le Muséum national d’Histoire naturelle regroupe 10 institutions qui sont les acteurs de sa réalisation. Ces 10 institutions travaillent ensemble sur les 3 volets de notre programme :
L’IRD est un EPST multidisciplinaire, qui a la spécificité de se consacrer à la zone inter-tropicale et à la recherche en partenariat avec les institutions académiques des pays de cette zone. Elle s’appuie sur son expérience de l’informatisation de collections, la gestion et l’exploitation des collections informatisées, et sa compréhension des enjeux associés. Sur la base de cette expérience, l’unité UMMISCO de l’IRD apporte ses compétences spécifiques en IA, apprentissage et classification automatique, notamment l’utilisation des réseaux de neurones profonds dans des contextes divers (intégration des données complexes biomédicales, analyse d’images sonar, dénombrements d’objet dans des images, reconnaissance de caractères morpho-anatomiques dans des images d’herbier, etc.). En particulier ils sont spécialisés sur les aspects d’interprétabilité des modèles complexes notamment dans le contexte des applications translationnelles médicales.
Sorbonne université est une université pluridisciplinaire, de recherche intensive et de rang mondial. Associée avec 5 autres institutions, dont le MNHN, et avec des partenaires comme le CNRS, l’INSERM et l’IRD, elle forme l’Alliance Sorbonne Université. La faculté des Sciences et Ingénierie rassemble un spectre particulièrement large et compréhensif des sciences tant formelles que naturelles ou encore expérimentales ou technologiques.
Avec le Centre de calcul de Sorbonne université et l’unité mixte internationale UMMISCO (Unité de Modélisation Mathématique et Informatique des Systèmes Complexes-IRD) développe la fouille de texte par l’IA afin d’enrichir les bases de données du système expert XPER3.
L’université de Bourgogne accueille plus de 34000 étudiants sur 6 campus. Elle est composée de 8 UFR, 8 écoles et instituts, 32 laboratoires et 6 écoles doctorales, animés notamment par 3300 permanents. Elle est l’un des membres fondateurs du programme PIA « e-ReColNat » (2013 à 2021) et de l’Infrastructure de Recherche ReColNat (Réseau des collections naturalistes). Riche de collections naturalistes dépassant le million de spécimens, l’Université de Bourgogne est particulièrement mobilisée sur les collections naturalistes, leur enrichissement, leur valorisation, notamment en menant des activités scientifiques tournées vers les objets naturels actuels et fossiles.
L’Université Claude Bernard Lyon 1 (UCBL) bénéficie d’un rayonnement international dans les domaines des sciences, des technologies, de la santé et du sport. Elle est adossée à 62 laboratoires de recherche, portés par 4600 personnels, sur 11 sites et 3 campus. Elle accueille plus de 47 000 étudiants. L’université est un membre fondateur du Groupement d’Intérêt Scientifique RECOLNAT, après avoir participé au Programme d’Investissement d’Avenir « e-ReColNat ». Les 3 collections naturalistes de l’université (paléontologie-géologie, herbier, zoologie) regroupent plus de 13 millions de spécimens. Elles sont des plateaux analytiques du Laboratoire de Géologie de Lyon (UMR 5276 LGL-TPE) et de la Fédération de Recherche 3728 BioEEnViS. Ces collections, très investies dans la gestion des données et l’imagerie 2D/3D, sont une ressource précieuse pour la recherche internationale en biodiversité passée et présente.
L’université de Montpellier est composée de 16 écoles et instituts, regroupant 78 structures de recherche. Elle possède l’expérience de la gestion et de la conservation des collections physiques importantes, toutes disciplines confondues. Depuis 2004, elle a investi dans l’informatisation des spécimens à grande échelle, notamment en botanique (herbier MPU), en zoologie et en paléontologie. L’université de Montpellier exploitera cette dynamique pour améliorer l’accessibilité des collections déjà numérisées et celles issues de son enrichissement permanent.
L’École Pratique des Hautes Études (EPHE) établissement-composante de l’Université PSL (Paris Sciences et Lettres), est un grand établissement d’enseignement supérieur. Elle propose des formations à la recherche par la pratique de la recherche dans ses trois sections : Sciences de la vie et de la terre (SVT), Sciences historiques et philologiques (SHP) et Sciences religieuses (SR). Son enseignement est essentiellement dispensé au niveau du master et du doctorat. L’EPHE emploie 270 enseignants-chercheurs et s’insère dans 45 unités de recherche.
Le CNAM est un grand établissement d’enseignement supérieur et de recherche fondamentale et appliquée fondé par l’abbé Henri Grégoire à Paris le 10 octobre 1794 pour perfectionner l’industrie nationale. Par l’intermédiaire de son équipe de recherche Dicen-IdF, a une expérience du travail collaboratif, de la gestion des documents et des interfaces et de leur conception. L’outil d’annotation d’images 2D Annotate-On pour les sciences naturelles qu’il a développées dans le cadre du PIA e-ReColNat est maintenant étendu aux usages d’apprentissage profond (comme l’analyse des écrits musicaux dans Gallica à la BnF) et à l’annotation chronothématique des images animées (avec les Archives nationales et la BnF).
Le CINES propose des moyens exceptionnels à l’ensemble de la communauté scientifique dans ses missions statutaires stratégiques nationales : le calcul numérique intensif, la préservation à long terme de données électroniques et l’hébergement de plates-formes informatiques d’envergure nationale. Il est depuis 2004 l’opérateur pour l’archivage des données et documents numériques produits par la communauté de l’Enseignement Supérieur et Recherche française (ESR). Dans ce cadre, il a développé une expertise dans le stockage de données massives, les formats de fichiers ou encore les standards de métadonnées, et propose des solutions de conservation digitale sur le moyen et long terme, mutualisées, économiques et personnalisables. Situé à Montpellier (France), le CINES est l’un des trois centres nationaux de calcul intensif (avec le CEA-TGCC et le CNRS-IDRIS) depuis plus de 30 ans.
Le Centre National de la Recherche Scientifique (CNRS) est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation. Ses missions consistent à faire progresser la connaissance et être utile à la société en faisant de la recherche scientifique, en valorisant les résultats, en partageant les connaissances, en formant par la recherche et en contribuant à la politique scientifique du pays. Cet organisme national de recherche emploie 33 000 agents (dont près de 29 000 scientifiques) et est implanté dans plus de 1100 laboratoires de recherche en France et à l’étranger.
Le MNHN est un grand établissement d’enseignement supérieur et de recherche fondamentale et appliquée fondé à la Révolution française à partir du Jardin des plantes médicinales créé par Louis XIII en 1635. Coordinateur du projet, le MNHN, via ses plateformes de numérisation 3D, bénéficie déjà d’une expertise dans le domaine de la numérisation. Le personnel des plateformes Surfaçus et AST-RX ont déjà numérisé des milliers de spécimens des collections, signalés dans la 3Dthèque. Le programme e-COL+, travaillant main dans la main avec ces plateformes, est une formidable opportunité pour valoriser cette expertise, améliorer les méthodes et processus de numérisation ainsi que les outils informatiques pour co-construire une politique de numérisation à l’échelle de nationale.