Le projet HALiance vise une refonte des services cœur de HAL et un alignement sur les recommandations et les critères d’excellence définis par l’ESR français (Plan National pour la Science Ouverte) et dans le cadre des initiatives internationales en faveur de la science ouverte (COAR, EOSC, cOAlition S). Il s’appuie sur une renouvellement du socle matériel et logiciel. Il doit permettre à HAL de répondre aux enjeux internationaux d’excellence, d’agilité technologique et d’interconnexion renforcée.
Le projet est divisé en 9 lots (workpackages). |
|
WP1 - Infrastructure matérielle
- L’infrastructure physique de HAL est en capacité de s’adapter à une augmentation conséquente des données à stocker et à traiter,
- Le système de sauvegarde est redondant,
- Démarches de mise en œuvre d’un Plan de continuité d’activités.
Réalisations :
2022
|
Mise en place du répartiteur de charge HAProxy ALOHA Changement d’un switch (passage à un switch optique) Mise en place d’un cluster SolR Installation d’un cluster Mysql pour usage futur Instruction technique d’une solution de sauvegarde redondante |
2023 |
Recrutement d’un Ingénieur système Nouveau serveur de stockage NAS Basculement sur HaProxy pour garantir la haute disponibilité Amélioration des performances réseau (Installation de switchs optiques et de cartes 10gb) Préparation de la sauvegarde des données dans un second datacenter |
WP2 - Infrastructure logicielle
- Un nouvel environnement de développement applicatif est déployé,
- Le code source de HAL est ouvert et publié.
Réalisations :
2022
|
Études d’architectures et de migration Constitution du product backlog (ensemble des fonctionnalités et des tâches, priorisation) |
2023 |
Recrutement d’un développeur Démarrage du projet de migration applicative (prestation) |
WP3 - Extraction et alignement des métadonnées
- La récupération des entités nommées au sein des fichiers pdf des publications est optimisée et automatisée : Auteurs, Institutions, Financeurs et Projets, Licences, Infrastructures, citations de logiciels et de données de la recherche ;
- Les entités nommées sont alignées automatiquement sur les données de référence de HAL
Réalisations :
2022
|
Études de faisabilité pour l’amélioration de l’extraction des mentions de financement et de licences depuis le texte intégral Définition des spécifications du service d’affiliation automatique des auteur·es Échanges avec les partenaires Inria et Science-Miner |
2023 |
Enrichissement de auréHAL avec l’identifiant ROR, en collaboration avec l’équipe du Baromètre de la Science Ouverte (BSO) Étude préliminaire et prototype de la récupération automatique des données sur les financements dans les fichiers pdf (partenaire Science-Miner pour évolution de l’application Grobid) Préparation de la refonte du service d’affiliation automatique des auteurs |
WP4 - Gestion des métadonnées bibliographiques importées
- La provenance des métadonnées est documentée (conservation des informations relatives à la source)
- La traçabilité des métadonnées est documentée (conservation des informations sur le cycle de vie des métadonnées, les actions de création, modification et suppression)
- Des règles de gestion de conflit sont définies et implémentées
- Les données importées sont synchronisées avec celles de la base HAL
Réalisations :
2022
|
Définition des spécifications (traçabilité des métadonnées, règles de gestion de conflit) Échanges avec le partenaire IN2P3 |
2023 |
Les actions de ce work package dépendent de l’avancée du WP2 |
WP5 - Qualification des preprints
- HAL est automatiquement notifié du reviewing d’un preprint et des versions mises à jour du preprint
- Les différents statuts du preprint sont connus et affichés (preprint relu, recommandé, accepté pour publication, différentes versions du preprint, open peer review, etc.)
- Les chercheurs qui déposent des preprints dans HAL se voient proposer des services externes de relecture
Les actions s’inscrivent dans la continuité du projet HALOWIN. Celui-ci s’est terminé fin 2023.
WP6 - Collecte ciblée de publications
- Un mécanisme permet de repérer les publications scientifiques pouvant être intégrées à HAL et d’alimenter HAL avec elles
- Des outils de dédoublonnage, d’enrichissement et de gestion de version sont disponibles
- Des chercheurs disposent d’interfaces web pour valider ou non l’import de leurs publications dans HAL
- Les communications présentes dans la plateforme SciencesConf sont transférées vers HAL de manière automatisée
Réalisations :
2022
|
Exploitation du corpus produit par l’Inist dans le cadre du projet CorHAL Démarrage de l’implémentation du service Recrutement d’un développeur |
2023 |
Mise en production du service de suggestions de dépôts : interface utilisateur, back office de suivi, workflow de reversement dans HAL |
WP7 - Liens publications - données de la recherche
- Une solution automatisée repère et associe à la publication déposée dans HAL l’identifiant et la citation des données associées
- Un service permet de déposer un jeu de données associé à une publication et de le transférer vers l’entrepôt de données idoine
- HAL est interopérable avec Nakala (SHS) et les entrepôts Dataverse (notamment Recherche.data.gouv)
Réalisations :
2022 | Échanges avec le partenaire INRAE dans le cadre de l’entrepôt national recherche.data.gouv |
2023 |
intégration du protocole COAR Notify dans HAL |
WP8 - Accompagnement et engagement des communautés
- Les utilisateurs de l’équipement sont associés à la conception des nouveaux services HAL
- La documentation fonctionnelle et technique est disponible
- Une offre de formation multi-modale est proposée aux utilisateurs de l’équipement
- Les utilisateurs de l’équipement sont informés de l’avancement général du projet
Réalisations :
2022
|
Définition d’un plan de communication Définition d’un plan d’action pour l’implication des utilisateurs |
2023 |
Campagne d’alignement ROR (WP3) Recueil des avis utilisateurs pour le nouveau service de suggestions (WP6) Rédaction de la documentation utilisateur sur le service de suggestions Publication de plusieurs billets de blog sur le site web du CCSD |
WP9 - Principes FAIR
- Une démarche de certification Core Trust Seal est engagée
- Des indicateurs FAIR sont mis en œuvre
Réalisations :
2022 | Recrutement d’un data steward pour prendre en charge la certification CoreTrustSeal |
2023 |
Recrutement d’un data steward Audit en interne en vue de la certification CoreTrustSeal, collecte des informations pour la rédaction du rapport Rédaction des pages about.hal.science |
Fiche signalétique du projet
Financeur |
Équipements structurants pour la recherche du P.I.A.3 – ESR/EquipEx+ |
|
Référence projet | ||
Durée du projet |
5,5 ans |
|
Financement |
3,4 M€ |
|
Début du projet |
janvier 2022 |
|
Consortium |
CNRS, Inria, IN2P3, INRAE |
|
Partenariats |
Equipex+ Commons |