Contexte
La création de l’ASNR (fusion ASN+IRSN) exige un suivi fiable de la production scientifique et du taux d’Open Access. Le BSO institutionnel vise à consolider 2013–2024 malgré l’hétérogénéité des bases et le bruit d’affiliation.
Rapport de stage (M1 GSI, Paris 8) : construction d’un Baromètre de la Science Ouverte pour l’ASNR.
Mon travail à l’ASNR s’inscrit dans la continuité d’initiatives antérieures autour de la science ouverte (constitution d’une base de thèses et mise en place d’une collection HAL IRSN), avec un objectif désormais central : concevoir et déployer un Baromètre de la Science Ouverte (BSO) institutionnel. Le BSO constitue un outil de pilotage : il consolide des sources hétérogènes (Scopus, OpenAlex, HAL), clarifie les périmètres (DOI vs DOI ∪ idHAL), fiabilise les indicateurs (taux d’OA, couverture des bases, apports marginaux) et documente les choix méthodologiques (dédoublonnage “DOI-first”, contrôle du bruit d’affiliation, traçabilité des transformations). Il permet ainsi d’objectiver la performance de l’établissement en matière d’accès ouvert, de prioriser les actions (dépôts, corrections de métadonnées) et de soutenir la décision dans un contexte de forte exigence de transparence. Le rapport présente d’abord le cadre (ASNR et périmètre d’analyse), puis la méthodologie et les résultats du BSO, avant d’ouvrir sur une analyse critique des points sensibles observés (définition des dénominateurs, qualité des correspondances d’affiliation, reproductibilité des traitements). Cette approche vise à offrir un dispositif robuste, réutilisable et aligné avec les exigences de la science ouverte.
La création de l’ASNR (fusion ASN+IRSN) exige un suivi fiable de la production scientifique et du taux d’Open Access. Le BSO institutionnel vise à consolider 2013–2024 malgré l’hétérogénéité des bases et le bruit d’affiliation.
Pipeline “DOI-first” : construction d’une base maître, dédoublonnage, consolidation Scopus/OpenAlex/HAL, enrichissement Unpaywall (OA/licences), contrôles manuels ciblés. Périmètres explicités (DOI vs DOI∪idHAL), scripts reproductibles et traçabilité des choix.
Couverture objectivée (OpenAlex ≥70% avec ~20% hors Scopus), taux d’OA mieux estimés grâce aux dépôts/corrections HAL. Indicateurs actionnables pour la gouvernance et un processus pérenne qui réduit le bruit et le temps de curation.
Comment fiabiliser un BSO institutionnel pour l’ASNR à partir de sources hétérogènes comme Scopus, OpenAlex et HAL en limitant le bruit et en maximisant le dépôt OA réel ?
Constitution d’une base maître, dédoublonnage par DOI, contrôle typologies.
APIs OpenAlex/Scopus/HAL, ajout OA/licence via Unpaywall.
Croisements, vérifs manuelles, dépôts HAL, reporting intermédiaire.
// Dédoublonnage "DOI-first" et fusion des métadonnées
for each DOI-group g:
if |g| > 1:
// Priorité de qualité : Scopus > OpenAlex > HAL (si présent)
keep = argmax_r score_metadata(r)
merge(keep, g \ {keep}) // union des champs non vides
else:
keep = only(g)
append(keep)
// Exemple de score simpliste
score_metadata(r) = w1*has_crossref_type(r) + w2*completeness(r) + w3*source_priority(r)