Computer Vision and Historical analysis of Scientific illustration circulation (VHS)

Le projet VHS propose une approche nouvelle pour l’étude historique de la circulation des savoirs scientifiques fondée sur de nouvelles méthodes d’analyse de l’illustration. Grâce aux derniers développements de l’IA et de la vision artificielle, l’objectif est de concevoir un instrument d’analyse inédit fondé sur l’étude des modalités d’évolution et de transformation des images dans des corpus scientifiques illustrés du Moyen Âge et de la période moderne. Nous développerons pour ce faire des méthodes d’apprentissage non ou faiblement supervisées permettant d’effectuer des recherches automatiques d’envergure adaptées à ces corpus, fondées sur la détection de similarités iconographiques (entre les images, afin de repérer les processus de copie et d’emprunt notamment) et textuelles (entre les images et les légendes ou les textes associés, pour repérer par exemple des images différentes décrivant des contenus textuels similaires). Ces méthodes fourniront aux historiens de nouvelles associations d’illustrations et relations possibles (intericoniques et/ou intertextuelles) dont l’analyse apportera de nouvelles réponses sur plusieurs questions essentielles des études sur les modalités de circulation des savoirs scientifiques illustrés, à commencer par la place et le rôle de l’image dans la transmission de ces savoirs.
Le projet associe pour ce faire trois partenaires reconnus : l’équipe Humanités numériques de l’Institut des Sciences du Calcul et des Données de Sorbonne Université ; l’équipe Monde Byzantin du laboratoire Orient & Méditerranée (UMR 8167) ; l’équipe Imagine du Laboratoire d’Informatique Gaspard Monge de l’École des Ponts ParisTech (ENPC) qui rassemblent des spécialistes de l’histoire des sciences, de l’illustration scientifique, de la vision artificielle et de l’apprentissage profond.
L’équipe VHS est animée par une démarche fortement interdisciplinaire qui se structurera sur les quatre ans du projet autour notamment d’ateliers internes réguliers, permettant de croiser les compétences, les approches et d’organiser le travail, et d’un séminaire public mensuel dédié aux études sur la circulation de l’illustration scientifique. Le travail sera conduit sur quatre corpus illustrés, deux corpus manuscrits médiévaux et deux corpus imprimés de l’époque moderne, couvrant trois domaines de savoirs, l’histoire naturelle, les mathématiques, la pharmacologie. Ces corpus seront indexés et leurs illustrations automatiquement extraites dans une base de données IIIF dotée d’une interface de consultation et d’annotation dont la mise en place constituera la première phase du projet. Le consortium travaillera ensuite parallèlement au développement des méthodes de détection de similarités, à l’analyse conjointe des tests effectués, ainsi qu’à l’étude historique des résultats obtenus et aux enjeux méthodologiques associés.
L’approche adoptée, mêlant étroitement sciences humaines et sciences des données, inscrit résolument le projet dans le domaine des humanités numériques, où VHS apportera un résultat concret et important à destination des historiens des sciences, des techniques, de l’art et de la communauté des visual studies : la mise à disposition de ses méthodes sous la forme d’une API IIIF, conçue comme un environnement de recherche pour l’analyse de la circulation du savoir scientifique par le biais de l’image. Ces méthodes constitueront aussi des apports originaux dans le domaine de l’IA, sur plusieurs problèmes importants, tels que l’apprentissage faiblement supervisé sur des représentations fines d’images incluant des données textuelles faiblement alignées. Les résultats seront diffusés académiquement (publications, conférences, préparation d’un ouvrage collectif) dans toutes les disciplines impliquées. Ils seront aussi pédagogiquement valorisés grâce à la mise au point de matériaux éducatifs pour les enseignants du primaire et du secondaire, ainsi que la mise en place d’une UE de Master en humanités numériques.