Le projet e-COL+ retenu par le Programme d’Investissement d’Avenir (PIA3), associe la production de modèles 3D au développement de filières méthodologiques innovantes basées sur l’Intelligence Artificielle (IA), utilisant des techniques d’apprentissage machine et en profondeur pour l’indexation et le traitement des modèles de surface et de tomographie. Le projet d’une durée de 8 ans et il est cofinancé par l’Agence National de la Recherche (ANR-21-ESRE-0053 ) et les partenaires CNRS, IRD, SU, uB, UM, UCBL, CINES, EPHE, le CNAM et le MNHN (porteur du projet).
Le projet e-COL+ vise à dynamiser la valorisation des collections naturalistes par la production de fichiers numériques d’imagerie 3D de spécimens d’histoire naturelle conservés dans divers musées et institutions françaises. La maîtrise des équipements 3D permet aujourd’hui une production d’images en nombre et donne l’accès à de nouveaux jeux de données. Le programme de production consiste à accroître le fonds disponible de 5 000 modèles par an en moyenne tant en surfaciques qu’en micro-tomographie et y associer un développement de post-traitement accéléré grâce à l’IA.
Les investissements associés à ce financement Equipex+ permettent aux partenaires de se doter d’équipements de pointe, adaptés à la numérisation d’objets naturalistes recouvrant une multitude de tailles, de textures et aux modes de conservation variées (matériel sec, en fluide, épinglé, etc.). En effet, au-delà des équipements nécessaires à la numérisation, ce programme Equipex+ vise à développer des outils d’Intelligence Artificielle (IA) pour automatiser la segmentation et l’étiquetage des différentes parties des modèles 3D issus de la numérisation des spécimens et ainsi faciliter la reconnaissance et l’analyse des caractères. Pour compléter la chaine de numérisation, le programme e-COL+ prévoit le développement d’outils de stockage et d’archivage des données de numérisations, ainsi que leur mise à disposition simple, rapide et efficace. La création d’un jumeau numérique pour les espèces numérisées s’inscrit dans le concept de spécimen étendu. Les métadonnées contextuelles des spécimens représentant ces espèces sont cataloguées dans la base RECOLNAT, dont les données respectent les principes FAIR (Findable, Accessible, Interoperable, Reusable) et s’inscrivent dans le projet d’unification digitale des bases de données européennes porté par l’Infrastructure DiSSCo.