Alignement des autorités RERO+ avec IdRef: où en est on ?

Alignement des autorités RERO+ avec IdRef: où en est on ? image

En octobre 2022 le million d'alignements a été largement dépassé avec un nombre global de 1'115'016, soit 121'590 autorités de plus qu'en décembre 2021 où 993’426 autorités avaient été alignées au total.

Petit rafraîchissement de mémoire…

En 2021, les bibliothèques RERO se sont séparées en deux réseaux distincts: SLSP et RERO+. Pour maintenir leur collaboration au niveau des autorités, elles ont décidé d’intégrer toutes les autorités “noms propres” au référentiel français IdRef. Une belle évolution, mais qui implique un énorme travail d’alignement (1). Cet alignement peut se faire en partie de manière automatisée, mais requiert dans de nombreux cas une vérification ou un travail manuel.

Un travail initial sur les cas les plus évidents a été réalisé en 2021 déjà, notamment par l’ABES. Ce travail se poursuit aujourd’hui encore.

Par ailleurs, au printemps 2022, le groupe "Indexation romande" a décidé de passer aux autorités RAMEAU via IdRef, ce qui implique un travail supplémentaire d’alignement, mais ne concerne que les noms communs…

Vous vous perdez dans toute cette terminologie?

Rien de mieux qu’un petit schéma pour avoir la vue d’ensemble

Le graphique ci-dessous présente un panorama des types d’entités gérées par RERO+ (et par l’ancien RERO), ainsi que de leur volumétrie. A noter que les familles sont intégrées à la catégorie "Personnes".

graph_repartition_autorites

Et voici les explications:

  • ATC signifie Auteur-Titre-Collectivité. Il s’agit historiquement des autorités utilisées pour la recherche par auteur dans les catalogues sur fiches (2)… et lorsqu’il n’y avait pas d’auteur, c’était par titre.
  • Les autorités Matières étaient le pendant des ATC, mais pour accéder aux fiches dans les petits tiroirs, par sujet. Un sujet peut par exemple être une personne, une collectivité, un lieu, un nom commun comme “philosophie” ou “aviation”, etc. Certaines entités étaient donc décrites à double, une fois en tant que matière, une fois en tant qu’ATC, ce qui n’est plus le cas dans IdRef.
  • Les autorités permanentes ont fait l’objet d’un travail de description vérifié par les bibliothèques, possèdent une notice pour elles dans le catalogue, et ont une valeur patrimoniale.
  • Les autorités temporaires à l’inverse étaient, dans RERO, générées automatiquement par le système et composées uniquement d’un point d’accès autorisé. Elles sont donc de qualité moindre, et font parfois des regroupements erronés.
  • Les autorités "Nom propres" incluent les personnes, collectivités, noms géographiques, etc. Qu’elles soient Matières ou ATC, elles sont en cours d’intégration dans IdRef.
  • Les autorités "Noms communs" proviennent en majeure partie du référentiel RAMEAU de la Bibliothèque nationale de France, mais contiennent également des cas particuliers romands.

Travaux effectués par RERO+ et l'ABES en 2022 et état de la situation

L'entier des autorités "noms communs RERO-RAMEAU" (env. 112'000) ont été alignées automatiquement avec le référentiel RAMEAU. 1200 autorités collectivités et 500 personnes RERO supplémentaires ont été chargées dans IdRef ces derniers mois.

Groupe Qualité Type d’autorité Total Alignées %
ATC permanentes collectivités 60369 24650 41%
ATC permanentes conférences 3764 427 11%
ATC permanentes personnes 231903 162772 70%
ATC temporaires collectivités 155860 26266 17%
ATC temporaires conférences 54585 4810 9%
ATC temporaires personnes 1701551 710578 42%
matières permanentes collectivités 28304 9479 33%
matières permanentes conférences et autres réunions 4931 365 7%
matières permanentes noms communs (RAMEAU ou non) 167483 112000 67%
matières permanentes noms géographiques 39923 8696 22%
matières permanentes personnes 121997 52636 43%
matières permanentes titres uniformes 8446 2248 27%
matières temporaires collectivités 122 17 14%
matières temporaires conférences 34 0 0%
matières temporaires noms communs (hors RAMEAU) 24460 0 0%
matières temporaires noms géographiques 150 13 9%
matières temporaires personnes 450 57 13%
matières temporaires titres uniformes 30 0 0%
total 2604362 1115014 43%

Alignements manuels par les bibliothécaires RERO+ et SLSP

Le travail s'est surtout focalisé sur la vérification manuelle des autorités permanentes ayant le plus de notices bibliographiques liées dans le catalogue et des lieux suisses, comme l’illustre le graphique ci-dessous.

  • Le taux d'alignement des permanentes "personnes" ATC atteint maintenant 70%
  • 100% des autorités personnes ATC permanentes ayant 6 notices bibs liées ou plus ont été alignées ou sont candidates à la création automatique dans IdRef
  • Les lieux suisses ayant 3 occurrences ou plus ont tous été vérifiés manuellement et soit alignés, soit candidats à être créés dans IdRef

En combinant les 70% des personnes ATC alignées avec le fait qu’elles couvrent les plus fortes occurrences de notices bibliographiques, on peut déduire que le catalogue est déjà globalement bien aligné à IdRef, malgré une longue traîne, dont le traitement prendra du temps. Ce pourrait être l’objet d’une analyse ultérieure.

atc

Ainsi, en 2022, 18'890 alignements supplémentaires ont été réalisés en 10 mois. Remercions ici les bibliothécaires du réseau IdRef suisse qui chaque jour apportent leur pierre à l'édifice!

Le travail continue

1’200 collectivités et 800 personnes sont candidates à être chargées automatiquement dans IdRef avant la fin de l'année.

Un alignement automatique des autorités de type "familles" est prévu d'ici décembre et concernera plus de 20'000 notices candidates.

En tant que partenaire IdRef Suisse, Renouvaud travaille également sur les alignements pour son propre catalogue et a fourni plus de 6’000 nouveaux candidats à l'alignement repérés par leur outil Ouali.

La participation de toutes et tous à cette intégration des autorités suisses romandes dans IdRef est très encourageante pour l'avenir et illustre le dynamisme de ce projet fédérateur.


1. Un alignement est l’établissement d’une correspondance entre deux autorités (ici IdRef et RERO+) correspondant au même sujet. ⬆️

2. Vous voyez qu’on en ressent encore les conséquences dans l’organisation des données aujourd’hui. ⬆️

Partager