Huma-Num
L’amélioration de la qualité des données dans NAKALA : les opérations d’enrichissements des métadonnées
Huma-NumIR* travaille régulièrement à l’amélioration de la qualité des données dans NAKALA. Un premier bilan de ces chantiers a été présenté en novembre dernier. Ce nouvel article fait le point sur des opérations d’enrichissements des métadonnées réalisées et programmées dans NAKALA.
Les enrichissements réalisés ou à venir ajoutent une couche de normalisation ou de lien sur les valeurs des métadonnées existantes par alignement de celles-ci sur des vocabulaires ou par explicitation du référentiel dont elles sont issues. Ces alignements ou explicitations pourront prendre différentes formes suivant les cas.
Le premier cas traité est celui de l’identification des langues (champ “Langues” qui correspond à la propriété dcterms:language). Dans l’interface web de NAKALA, il est possible de choisir dans un menu déroulant une langue tirée du référentiel RFC5646. Une fois cette langue choisie, seul son code était inscrit dans les métadonnées. Les informations récupérées sont dorénavant :
- le code de la langue : indiqué dans la valeur de la propriété ;
- l’identifiant du référentiel : indiqué dans le type ou l’encodage de la propriété. Ici le type dcterms:RFC5646.
Depuis la mise à jour de NAKALA du 23 janvier 2025, les langues saisies de cette manière sont non-ambiguës puisqu’il est explicité, dans les métadonnées, que les codes renseignés sont à interpréter au sens du référentiel qui est indiqué. Dans le même temps, une opération d’alignement sur les valeurs déjà existantes a été menée : elle a consisté à ajouter cette information d’encodage partout où elle n’était pas exprimée (situation d’avant la date du 23 janvier 2025) alors que la valeur était bien déjà extraite de ce référentiel.
D’autres alignements sont en prévision, en particulier pour les mots-clés (champ “Mots-clés” correspondant à la propriété dcterms:subject) dont les valeurs sont souvent issues des référentiels utilisés par le mécanisme d’autocomplétion de l’interface web (c’est-à-dire principalement les référentiels RAMEAU, LCSH et PACTOLS).
De manière générale, au fur et à mesure que des référentiels se mettront en place dans NAKALA, Huma-NumIR* s’efforcera de lier les valeurs des métadonnées à ces référentiels, en les proposant à l’utilisation dans l’interface web et en menant des opérations d’alignement pour les valeurs déjà présentes dans NAKALA.
Journée d’accueil des Consortiums Huma-Num
Plusieurs membres du Consortium-HN Musica2 se sont rendus le 30.01.2025 à l’Humathèque du campus Condorcet pour un temps d’échange avec l’équipe d’Huma-Num et les équipes des huit autres Consortiums-HN. Cette journée vise à encourager des collaborations et synergies entre les différents Consortiums labellisés par le biais d’un partage de nos bilans et objectifs.
Nous avons notamment fait le point sur nos projets pour 2025 : dépôts de nouveaux projets scientifiques et continuation de chantiers en cours, avancée des livrables et outils, dispositifs de formation développés, ainsi que notre inclusion dans la communauté scientifique à travers divers événements.
Mise en production du circuit de modération des données dans NAKALA
En juin dernier, Huma-NumIR* annonçait la mise en place dans NAKALA d’un circuit de modération documentaire des dépôts. Aujourd’hui les développements nécessaires sont opérationnels et documentés :
- https://documentation.huma-num.fr/nakala-qualite/#fonctionnement-de-la-moderation-des-jeux-de-donnees-dans-nakala
- https://documentation.huma-num.fr/nakala/#zone-demander-la-moderation-de-cette-donnee
Pour rappel, la modération a pour objectif d’accompagner à améliorer la qualité documentaire des dépôts afin de faciliter leur découvrabilité et de garantir leur lisibilité sur le temps long.
Sur les grands principes :
- le dépôt et la publication des dépôts restent à l’initiative du déposant ;
- seuls le déposant et le gestionnaire d’un dépôt ont la possibilité de demander la modération de leur dépôt.
Voici les fonctionnalités développées dans NAKALA dans le cadre du projet de modération :
- un nouveau statut “modéré” a été créé pour les données. Il est réservé aux dépôts dont le niveau de qualité aura été évalué par un modérateur ;
- un nouveau rôle “Modérateur” a été créé : ce rôle permet de modifier le statut du dépôt pour lui attribuer le statut “Modéré” ;
- une nouvelle zone “Demander la modération de cette donnée” a été ajoutée. Cette zone est activée pour les gestionnaires du dépôt qui ont alors accès à une liste de modératrices et modérateurs ;
- cette liste de modératrices et modérateurs est gérée par l’équipe Huma-NumIR*. Elle affiche les nom, prénom et le périmètre géographique de chaque modérateur. Le choix doit porter prioritairement sur un modérateur local, ie le modérateur affilié à l’établissement ou site universitaire du gestionnaire de dépôt;
- une facette de recherche “Données modérées” a été ajoutée pour retrouver facilement toutes les données qui ont suivi le circuit de modération et ont obtenu le label de qualité documentaire.
Circuit de la demande de modération :
→ le gestionnaire d’un dépôt fait une demande de modération en sélectionnant le nom d’une modératrice ou d’un modérateur dans la liste. Le gestionnaire doit privilégier le modérateur local, ie celui affilié à son établissement ou site universitaire ;
→ après avoir sélectionné le modérateur : une confirmation de la demande est envoyée au gestionnaire ; en parallèle, la demande de modération est notifiée automatiquement au modérateur sélectionné ;
→ le modérateur prend contact avec le gestionnaire qui a fait la demande de modération ; la phase d’échanges et d’évaluation se déroule en toute autonomie ;
→ le modérateur évalue la qualité de la donnée d’après une liste de critères définis dans la grille de modération et attribue le statut ‘Modéré’ au dépôt le cas échéant ;
→ une fois le statut ‘Modéré’ attribué, la page de présentation affiche de nouvelles informations : le label ‘Modéré’ apparaît ainsi que le nom du modérateur et la date de la modération.
→ si la donnée est modifiée par la suite, elle perd automatiquement le statut ‘Modéré’
Les déposants et modérateurs trouveront le guide de dépôt et la grille de modération dans la rubrique “qualité” de la documentation de NAKALA.
L’équipe NAKALA peut être contactée à l’adresse nakala[at]huma-num.fr
[Rencontre Hypertextes] Lectures du Centre Internet et Société (CIS) avec Payal Arora
Journée d’études : Les Humanités numériques pour la recherche et la formation
Joann Élart (COPIL, GT3) et Thomas Bottini (GT2) ont communiqué à la journée d’études : “Les Humanités numériques pour la recherche et la formation”, co-organisée par Pierre Couprie (GT4).
Présentation de Thomas Bottini : “Modéliser, saisir, explorer – retour sur la mise en oeuvre du CIDOC CRM dans des bases de données en musicologie”
L’IR* Huma-Num recrute un ou une chargé(e) de projets d’information documentaire
L’IR* Huma-Num recrute, dans le cadre du PEPR ICCARE (Industries Culturelles et Créatives : Action, Recherche, Expérimentation), un ou une chargé(e) de projets d’information documentaire.
Rejoignez Huma-NumIR*!
La personne recrutée sera en charge de la mise en œuvre et du suivi, sous la responsabilité de la direction de l’IR* Huma-Num, d’un pôle d’expertise sur la qualité des données et métadonnées des industries culturelles et créatives.
Les principales activités seront les suivantes :
- Animer la participation des différents pôles d’Huma-NumIR* dans la mise en place du pôle d’expertise sur les données et métadonnées dans le cadre du PEPR ICCARE (recherche sur et avec les Industries Culturelles et Créatives) ;
- Accompagner les projets dans la gestion et la qualité des données ;
- Assurer le suivi du développement d’outils logiciels, modèles de données et référentiels au service des projets.
La personne recrutée sera affectée à l’antenne parisienne de l’unité (Campus Condorcet à Aubervilliers 93). Des déplacements seront à prévoir sur les autres sites de l’unité, en particulier au 54 bd Raspail, Paris 6ème, ainsi qu’auprès des interlocuteurs du PEPR. Cette offre d’emploi est proposée pour une durée de 12 mois. Un renouvellement de 2 ans est prévu en fonction du bilan de la 1ère année.
Prise de poste prévue au 1er mars 2025.
Détails du poste, des missions et candidature en cliquant ici
L’IR* Huma-Num recrute un ou une chargé(e) d’enquête documentaire
L’IR* Huma-Num recrute, dans le cadre du PEPR ICCARE (Industries Culturelles et Créatives : Action, Recherche, Expérimentation), un ou une chargé(e) d’enquête documentaire.
Rejoignez Huma-NumIR* !
La personne recrutée évoluera au sein du pôle d’expertise sur les données/métadonnées des ICC du PEPR ICCARE. Elle sera en charge de la conception, de la réalisation et de l’analyse d’une enquête sur l’état des lieux actuel des données et des métadonnées des ICC en France. Pour cette tâche, elle sera en binôme avec un contributeur du projet de niveau postdoctoral issu des sciences humaines et sociales.
Elle pourra être amenée à participer aux activités du pôle d’expertise en lien avec les résultats de l’enquête.
Les principales activités seront les suivantes :
- Concevoir un questionnaire destiné aux acteurs des ICC dans toutes leurs composantes ;
- Mener les entretiens (présentiel/visioconférence) ;
- Concevoir et mettre en œuvre une méthode d’analyse des résultats ;
- Produire une synthèse des résultats sous forme d’un rapport détaillé ;
- Intégrer les résultats dans une base de données relationnelle ;
- Participer aux activités du pôle d’expertise sur les données/métadonnées des ICC (expertise, actions de formation et de sensibilisation, support aux projets).
La personne recrutée sera affectée à l’antenne parisienne de l’unité (Campus Condorcet à Aubervilliers 93). Des déplacements seront à prévoir sur les autres sites de l’unité, en particulier au 54 bd Raspail, Paris 6ème, ainsi qu’auprès des interlocuteurs du PEPR. Cette offre d’emploi est proposée pour une durée de 12 mois.
Prise de poste prévue au 1er mars 2025.
Détails du poste, des missions et candidature en cliquant ici.
Newsletter #41 – Janvier 2025
Newsletter #40 – Décembre 2024
Cycle de webinaires Huma-Num : de nouvelles dates en 2025 disponibles !
L’équipe de l’IR* Huma-Num propose aux personnels des communautés SHS des séances de formations en webinaire tout au long de l’année. Le programme des premières séances de 2025 est mis en ligne et les inscriptions sont ouvertes. L’inscription est obligatoire mais le nombre d’inscrits n’est pas limité.
Les webinaires d’Huma-Num, d’une durée de 2h, sont à destination de tous les personnels ingénieurs-techniciens, chercheurs et enseignants-chercheurs des communautés SHS amenés à utiliser les services d’Huma-Num pour la gestion de données de recherche.
Pour ce premier semestre 2025, les thématiques des webinaires sont les suivantes:
- Jeudi 16 janvier : Présentation générale de l’IR* Huma-Num et son offre de services
- Jeudi 30 janvier : Focus ShareDocs et outils de traitement
- Jeudi 6 février : Présentation des Consortiums Huma-Num
- Jeudi 13 mars : ISIDORE : Préparer ses données dans NAKALA pour leur signalement dans ISIDORE
-
Jeudi 27 mars : Utiliser ISIDORE pour faire sa recherche (niveau 2)
Le descriptif et les inscriptions aux séances se font depuis la rubrique formations du site d’Huma-Num.
Mobilité CNRS : l’IR* Huma-Num recrute un ou une ingénieure de recherche (IR) BAP E expert-e en infrastructures numériques
Huma-Num recrute un/une expert-e en infrastructures numériques – ingénieur.e de recherche (IR) BAP E – dans le cadre de la campagne de mobilité du CNRS. Rattachée au pôle Hébergement, stockage, traitement, Calcul (HSTC), la personne recrutée pilotera une partie de l’administration réseau et système de l’infrastructure de l’unité.
Rejoignez Huma-Num !
Huma-Num est une infrastructure de recherche (IR*) du Ministère de l’enseignement supérieur et de la recherche, mise en œuvre par le CNRS avec le Campus Condorcet et Aix-Marseille Université. Elle met en œuvre une infrastructure numérique permettant aux communautés SHS de développer, de réaliser et de préserver sur le long terme les programmes de recherche – leurs données et outils- dans un contexte de science ouverte et de partage des données.
L’infrastructure de l’IR* Huma-Num, composée de FireWall, WAF et Bastion (plateforme de virtualisation et baie de stockage sous l’autorité du CSSI de l’unité), sert de support pour l’hébergement de projet de recherche, des services numériques produits et/ou managés par l’unité et fournit des ressources de stockage et de calcul pour le traitement de données. La mission proposée sera notamment orientée vers la fourniture d’hébergement nécessitant des conditions de sécurité informatique renforcées.
Le poste est ouvert aux agents du CNRS et plus largement à tous les fonctionnaires.
Pour en savoir plus sur la mobilité interne (NOEMI), consultez les pages d’aide et le guide Mobilité Interne.
Date limite de candidature : 16 janvier 2025.
Prise de fonction au 1er avril.
Profil de poste et candidature dématérialisée en cliquant ici