Huma-Num
Atelier annotation – 6 mai 2025
Repenser la patrimonialisation du web avec le projet Millenium
Newsletter #44 – Avril 2025
Humanistica 2025 – Colloque annuel de l’Association francophone des humanités numériques
La spatialisation de données historiques multimodales en version Fair
Communiqué suite à la réunion publique “Heurist et les bases de données en SHS” du 31 janvier 2025
Réunion d’information “Heurist et les bases de données en SHS” (31/01/25) : relevé de conclusions et suites
Le 31 janvier 2025, s’est tenue, de 10h à 12h, dans l’Auditorium de l’Humathèque du Campus Condorcet et en distanciel, la réunion publique intitulée ”Heurist et les bases de données en sciences humaines et sociales”.
Dans le cadre d’une réflexion née au sein des Consortiums-HN et de plusieurs partenaires (MISHA, MSHMondes, BnF, Arscan) en 2023 sur la soutenabilité de l’outil Heurist, un groupe de réflexion sur la question de la durabilité de l’outil s’est constitué avec son concepteur, Ian Johnson. Une étude indépendante a été commandée par l’IR* Huma-Num dont les principaux résultats et pistes ont été présentés par Olivier Baude, directeur d’Huma-NumIR*.
Coordonné par Huma-NumIR*, le groupe de réflexion a poursuivi ses travaux par l’analyse de cette étude en parallèle de différents échanges sur les perspectives de l’outil. Issu de ce groupe de réflexion, un comité resserré travaille à des propositions concrètes sur le plan technique et à des scénarios de gouvernance. Ces scénarios ont été présentés lors de la réunion publique et celui retenu a été détaillé. Il repose notamment sur une transition en 6 mois (janvier-juin 2025) afin de stabiliser un socle technique robuste. Son développement serait financé par des bailleurs institutionnels assurant ainsi une visibilité à moyen et long terme.
Dans ce cadre, des ateliers techniques et de documentation sont organisés du 2 au 4 avril prochains et d’ores et déjà ouverts aux inscriptions pour les personnes désireuses et en capacité de s’impliquer
Ces ateliers permettront également d’identifier des personnes-ressources susceptibles de s’impliquer dans les différents comités prévus par la gouvernance (utilisateur.ice.s, développeur.se.s, etc.).
Enfin pour pour se tenir informé des travaux du groupe de réflexion sur la durabilité d’Heurist, une liste de diffusion a été créée. Les personnes qui le souhaitent peuvent ainsi s’y abonner en cliquant ici.
Newsletter #43 – Mars 2025
[séminaire] Cartographier l’occupation du delta du Tana au Kenya (VIIIe siècles – 1895)
Formation Masaplus : utiliser les outils MASA+ sur DMP OPIDoR
École d’été 2025: Open(ing) Science? Digital Humanities in Area Studies
Collection numérique de plans en perspective de Yoshida Matsuo
Formations MASAplus 2025
Journées d’accélération de l’ICCARE-LAB – “Partition et numérique”
Plusieurs membres du Consortium Musica2 étaient présents aux premières journées d’accélération du secteur Musique du PEPR ICCARE, accueillies au Centre de Musique Baroque de Versailles et consacrées aux problématiques inhérentes à l’édition numérique.
Réunissant éditeurs, musicologues, bibliothécaires et musiciens, ces deux journées ont été l’occasion d’aborder des sujets aussi divers que l’encodage de la musique, l’intelligence artificielle et l’usage des OCR/OMR, mais aussi les modèles de distribution pour la partition de demain et son rôle primordial dans la transmission. Ces échanges féconds ont permis d’envisager des collaborations futures et de mettre en regard différents usages de la partition numérique.
Newsletter #42 – Février 2025
GT5 > Atelier MEI > encodage et visualisation ; le cas de la musique médiévale
Des membres du Consortium HN Musica2 se sont réunis au CESR de Tours les 11 et 12 Février 2025 pour un atelier organisé par Christelle Chaillou (CESCM UMR 7302), Philippe Vendrix et Augustin Braud (CESR UMR 7323) autour de la thématique de l’encodage et de la visualisation de la musique médiévale ; l’occasion de découvrir des projets variés et de stimuler la réflexion collective.
David Chappuis (HEM Genève, CNSMD Lyon) a présenté son projet Chanter les motets de Philippe de Vitry (CMPV). Un outil de code (Minimae) a notamment été développé pour travailler sur ce corpus. Ce système présente l’avantage d’un grande interopérabilité : la sortie en MEI est satisfaisante et l’affichage VEROVIO très qualitatif, en plus de possibilités de stockage et comparaison des variants, insistant ainsi sur la nécessité d’une approche plurielle de l’édition critique.
Christelle Cazaux et Ugo Bindini (Schola Cantorum Basiliensis) présentent ensuite le SNF-Projekt Carmina Burana Online (PI) qui prend appui sur le TEI avant d’y intégrer des éléments MEI pour l’encodage des neumes du Codex Buranus (Munich, Bayerische Staatsbibliothek, Clm 4660-4660a). Cet exemple questionne les possibilités de visualisation de signes complexes et singuliers tout autant que les rapports entre musique et texte, notamment dans le positionnement des neumes. Le rendu utilise le format XSL pour transformer les fichiers XML en HTML et permettre leur visualisation en ligne.
Christelle Chaillou, Léontine Fortin et Rémi Bonnin (CESCM UMR 7302) présentent l’ANR MARITEM – Manuscrit du Roi (2019 – 2024) étudiant le fr.844, chansonnier du XIIIe siècle composite par bien des aspects. Ce projet s’appuie sur un seul fichier TEI d’environ 300 000 lignes au sein duquel des sous-fichiers sont extraits et mis en ligne par l’intégration d’un DublinCore étendu au sein d’Omeka S.
Richard Freedman (University of Haverford – Le Studium Visiting) nous a présenté ses derniers travaux autour des thématiques croisées de la science de données et de la musicologie. Divers scripts écrits dans les langages Python et Pandas permettent des opérations de traitement analytique de masse sur des fichiers MEI et de manière plus générale, de repenser la gestion des données dans le processus d’encodage de la musique.
Kévin Roger (Université de Lorraine, CRULH) est quant à lui revenu sur l’outil Python SubtiliorEditor – permettant d’améliorer l’encodage et la visualisation de certaines notations inhabituelles du XIVe siècle – développé en collaboration entre le Cluster6 Biblissima+ et le Consortium HN Musica2 ainsi que sur de futurs projets tissant des liens entre musicologie, science des données et IA.
Ailin Arjmand (CESR UMR 7223) nous présente son travail sur les tablatures dans le cadre du projet Albani (porté par le Cluster6 Biblissima+) par le biais d’un nouvel outil dédié à l’encodage des tablatures.
Laurent Pugin (RISM) conclut cette première journée par la présentation des dernières actualités et mises à jour de Verovio, outil de visualisation et transformation des fichiers MEI. Un travail conséquent a notamment pu être accompli sur la notation mensurale et le format CMME à l’aide du NFDI4Culture ; Verovio pourra désormais détecter d’éventuels soucis de manière autonome. Pour faire écho aux soucis rencontrés dans certains projets avec la visualisation des neumes, Laurent Pugin conseille de pointer vers des fichiers SVG externes.
À la suite de ces échanges particulièrement stimulants, une second journée a été consacrée à l’annotation collective du Guide de l’Édition Numérique en cours de rédaction par le GT5, dont la mise en ligne est prévue avant l’été 2025.
Une base de données sur l’art rupestre himalayen
[séminaire] Wikida… quoi ? A la découverte de la référence des bases de connaissances libres
Une nouvelle version du modèle de PGD pour l’archéologie
ISIDORE : un service en évolution constante
L’année 2024 a été marquée par une refonte complète de la plateforme ISIDORE, notamment au niveau de ses logiciels de traitement des données. Cette transformation vise à migrer ISIDORE vers une nouvelle infrastructure de serveurs en mode “Software as a Service” (SaaS) chez Antidot SA, un partenaire central depuis 2010. Basé à Lyon, Antidot SA a joué un rôle crucial dans le développement et la gestion des logiciels d’ISIDORE depuis plus de 14 ans. Cette évolution s’inscrit dans la continuité des changements initiés en 2022 et l’évolution des composants logiciels nécessaires au fonctionnement optimal de la plateforme.
Migration vers le SaaSCette migration vers le SaaS est le résultat d’un accord-cadre entre le CNRS et Antidot SA, conclu fin 2023 avec le soutien des services juridiques de la DR15 de Meudon. Le projet a été finalisé le 16 décembre 2024, avec la mise en production et le raccordement des nouvelles chaînes de traitement d’ISIDORE.
Orchestration de l’exploitationL’ensemble de l’exploitation d’ISIDORE est désormais orchestré par l’équipe du HN Lab et Antidot SA, assurant ainsi une continuité et une efficacité accrues dans la gestion de la plateforme. Cette collaboration vise à renforcer le positionnement de la France dans le développement des plateformes de valorisation, diffusion et recherche d’information scientifique, telles que ResearchGate, Academia, Clarivate, et JSTOR’s interactive research tool.
Nouvelles fonctionnalitésPlusieurs fonctionnalités ont été mises en place pour améliorer l’expérience utilisateur et l’efficacité de la plateforme :
- Enrichissement des identifiants auteurs : Une nouvelle chaîne d’enrichissement des identifiants auteurs (ORCID, IDREF, VIAF, ISNI, IDHAL) a été développée et sera affinée début 2025. Cette fonctionnalité, pilotée par une IA, vise à améliorer la découvrabilité des données et des publications.
- Re-exposition et découvrabilité des publications : Une nouvelle chaîne de re-exposition et de découvrabilité des publications et jeux de données via leurs identifiants (DOI, Handle, ARK, URN) a été mise en place pour améliorer la visibilité des publications dans les réponses du moteur de recherche (voir exemple ci-dessous).
- IA de détection et d’analyse des liens : Une IA de détection, d’analyse et d’exposition des liens entre données et publications a été intégrée pour enrichir les résultats de recherche.
- Altmetrics et pages utilisateurs : Les outils de Altmetrics ont été mis à jour pour inclure des indicateurs comme le nombre de partages sur le réseau social Bluesky. Les pages utilisateurs ont été améliorées pour permettre de lister l’ensemble de la production scientifique d’un chercheur, quelle que soit la plateforme de publication.
Tout au long de l’année 2024, la documentation pour les producteurs de données a été retravaillée pour accompagner au mieux celles et ceux qui souhaitent proposer des contenus dans ISIDORE (voir documentation). Si pour les publications (livres, revues, etc.) en SHS les pépinières de revues sont venues compléter les cinq grandes plateformes historiques (Cairn, Erudit, Open Edition, Persée, Redalyc), l’accompagnement a été principalement tourné vers les producteurs de données qui déposent dans les entrepôts de données SHS : Nakala, MédiHAL pour l’image, ODSAS pour l’ethnologie, Pandor pour les archives de la recherche, ArkéoGIS et le conservatoire des données 3D pour le patrimoine et l’archéologie, PROGEDO pour les données statistiques, etc. Le moissonnage de l’entrepôt national Recherche Data Gouv a été lancé en janvier 2024 (le moissonnage institutionnel des collections universitaires sera lancé à la demande en 2025). Au niveau international, les collections du QDR de l’université de Syracuse, d’Archipel (Canada), CONICET (Argentine), et l’entrepôt SHS de l’Université de Sydney sont venus augmenter leurs documents à l’aide de la documentation en anglais et en espagnol d’ISIDORE.
Remise en production des alertes pour la veille scientifiqueLa remise en production de la nouvelle version du système des alertes de veille scientifique d’ISIDORE a marqué une étape cruciale dans la remise en route d’ISIDORE (plus d’informations). Cette mise à jour vise à améliorer l’efficacité et la pertinence des alertes, permettant ainsi aux chercheurs et aux producteurs de données de rester informés des dernières avancées dans leurs domaines de recherche. L’ensemble des bibliothèques et outils d’alerte sont compatibles avec le logiciel de gestion des bibliographies Zotero et l’outil d’écriture pour Lettres et les SHS : Stylo (voir Stylo).
Mise à jour du module “IsidoreInZotero”Le module “IsidoreInZotero” offre la possibilité d’utiliser les documents contenus et enrichis dans ISIDORE depuis l’interface du logiciel de gestion de bibliographie Zotero. Cela permet de compléter des bibliographies directement depuis Zotero sans faire des allers-retours entre les outils. En 2024, le module a reçu une double adaptation : la mise à jour nécessaire pour Zotero 7 et pour la nouvelle API d’ISIDORE en raison du déménagement chez Antidot. Le module est disponible sous licence libre GPL 3.0 sur GitHub et fait l’objet d’un dépôt dans Zenodo (Zenodo), d’un archivage sur Software Heritage et il est signalé via OpenAIRE afin d’en maximiser la diffusion.
Développement du programme ISIDORE 2030ISIDORE 2030 est un programme de recherche et d’ingénierie visant à renouveler les fonctionnalités du moteur et assistant de recherche académique isidore.science. Lancé en 2010, ISIDORE a évolué avec l’intégration des intelligences artificielles génératives et sélectives. La feuille de route ISIDORE 2030 prévoit plusieurs chantiers, notamment l’intégration du Retrieval Augmented Generation (RAG), une technique combinant génération de langage naturel et recherche d’information pour améliorer les performances des grands modèles de langue.
Fonctionnalités attenduesParmi les fonctionnalités attendues pour ISIDORE 2030, on trouve :
- Analyse des contenus et rapprochement de corpus
- Tableaux de bord pour créer des états de l’art sur des questions scientifiques
- Proposition de résumés automatiques et synthèses de documents
- Traduction et analyses de qualité de traduction
- Exploration de communautés scientifiques
- Détection de thématiques et de communautés émergentes
- Veille scientifique
- Amélioration qualitative de métadonnées
Cette refonte vise à positionner ISIDORE comme un acteur clé dans le paysage des plateformes de recherche académique, en intégrant des outils innovants et performants. Pour plus de détails, consultez la feuille de route complète disponible ici.