3. Objectifs du projet

•    Proposer l’intégralité du corpus grâce à la numérisation des cours manuscrits. Les images numérisées du corpus sont accessibles à tous.
Le corpus contient des manuscrits de cours universitaires en géologie, paléontologie, minéralogie ou géographie physique.  Il peut s’agit de notes préparatoires prises par des professeurs ou de notes prises lors du cours par des étudiants. La majeure partie du corpus provient des notes manuscrites d’Abel Briquet, membre de la Société géologique du Nord et étudiant à l’Université de Lille à la charnière des XIXe et XXe siècles.

 

•    Mettre à disposition une édition XML-TEI d’une partie du corpus. L’édition électronique s’appuie sur des transcriptions en partie réalisées via des logiciels d’HTR (Handwritten Text Recognition).
Les documents du corpus actuellement disponibles ont été transcrits en partie grâce à des outils HTR, à savoir Transkribus et eScriptorium. L’accès à eScriptorium a été fourni par le consortium CREMMA. La production des vérités terrains nécessaires à l’entraînement des modèles de transcription automatique a bénéficié de la participation active de bénévoles de la Société géologique du Nord.

N.B. : XML - TEI est un format de balisage et communauté académique internationale dans le champ des humanités numériques visant à définir des recommandations pour l’encodage de ressources numériques et plus particulièrement de documents textuels

•    Permettre la consultation d’une édition numérique des textes transcrits sur le site https://coesciter-lillonum.univ-lille.fr/.
Le site CoESciTer donne accès à la transcription originale ainsi qu’à une transcription légèrement modifiée pour faciliter la lecture. [Le mode d'emploi sera mis en ligne début avril 2024]

•    Interroger le corpus par notions et objets scientifiques, grâce à un index, facilitant ainsi la recherche et l'exploration.
L’index a été créé en utilisant le logiciel Heurist (https://heuristnetwork.org/), qui permet de créer, stocker et mettre en forme une base de données.

Le corpus CoESciTer ouvre une fenêtre sur l'histoire de l'enseignement des sciences de la Terre, offrant aux chercheurs, aux étudiants et aux passionnés un accès privilégié à ces sources manuscrites.

Les deux années financées par CollEx-Persée ont avant tout permis d’expérimenter les outils et d’élaborer la méthodologie. Une continuation du projet permettrait d’étoffer et d’apporter plus de précisions dans la partie éditée du corpus. La coopération entre membres des sociétés savantes et des laboratoires et spécialistes de l’édition électronique et des bibliothèques numériques a été une dimension clé du projet.

Back to top