Des nouveaux clients et un focus sur la reprise de données Actualité - 02 septembre 2020
Ce mois-ci du côté Ligeo, découvrez-en plus sur notre processus de reprise de données et sur nos nouveaux clients !
Des nouveaux clients Ligeo Gestion
La ville de Mérignac choisit Ligeo Gestion pour ses archives. La ville de Houilles, dans les Yvelines, fait également confiance à Ligeo Gestion ! Ces deux nouveaux clients s’équipent pour la première fois d’un système d’information archivistique.
Bienvenue à eux !
La reprise de données : un enjeu majeur pour les services d’archives
La reprise de données est l’étape la plus importante dans la mise en place d’un Système d’Information Archivistique (SIA). On vous en dit plus sur la gestion de ce processus essentiel.
La donnée, l’essence même des archives
Au cœur d’un projet de Système d’Information Archivistique, l’étape de la reprise des données cristallise toutes les attentions. En archivistique, la donnée, aujourd’hui informatisée, matérialise la richesse d’un fonds. “Avec l’informatisation des services d’archives, un document papier devient une donnée. Plus globalement, ces données sont le cœur même des contenus de la plateforme Ligeo.” précise Laurence Salce, notre archiviste consultante.
En effet, différents types de données peuvent être repris avec Ligeo : les producteurs, les entrées mais aussi la structure des magasins, des espaces, le récolement des articles, et les instruments de recherche. Il est également possible de reprendre les bases de données lecteurs (comptes et historiques) et l’historique de communication des documents en salle de lecture et les thésaurus.
L’accompagnement Ligeo Archives
Vous seul connaissez vos données mieux que personne ! C’est pourquoi ce processus est un véritable travail d’équipe, comme le souligne Guillaume Lory, directeur des projets et chef de produit Ligeo Diffusion : “La reprise des données est la phase clé d’un projet d'informatisation de service d’archives. C’est véritablement ce qui fait le sel d’un projet : chaque reprise a ses spécificités et en raconte un peu plus sur l’histoire de chaque service d’archives. C’est un travail à la fois complexe mais aussi stimulant : un vrai challenge pour lequel il faut de l'expérience et les bons outils !”
Tous nos projets de gestion et de diffusion, impliquent une collaboration étroite avec nos clients, pour définir précisément le périmètre de reprise et les modalités de validation. Notre objectif : vous garantir une migration de vos données efficace et sans perte.
Ligeo Gestion et la reprise de données
La reprise de données est une étape importante au cœur de nos projets de gestion.
Pour ce faire, nous travaillons en toute transparence en analysant, avec vous, les fichiers à reprendre. De quels types de données s’agit-il : tableaux de gestion, producteurs d'archives, fonds ? Avec ce premier état des lieux, nous vous guidons ensuite pour “cartographier” l’emplacement des données dans Ligeo.
Cette première étape nous sert de base pour vous proposer ensuite une grille de test. Après la phase d’import et des tests en interne, nous vous ouvrons l’accès à une plateforme de test, pour que vous puissiez vérifier l’intégrité des données.
À chaque projet sa configuration unique
Le plus souvent, certaines données sont situées dans plusieurs fichiers distincts. Lors de la reprise, il est impératif de recréer des liens logiques entre elles. L’équipe Ligeo crée également de nouvelles données, utiles à Ligeo. Ce travail est essentiel pour assurer la cohérence et l’homogénéité des données. Globalement, tout projet de reprise commence avec l’import du fichier producteurs et de celui des entrées, qui dépendent l’un de l’autre.
Selon les projets, certaines données à reprendre sont déjà structurées : elles sont issues de bases de données et peuvent donc être exportées au format .csv. Dans ce cas, les fichiers sont repris avec un système de batch (programme informatique) automatisant la reconstitution des espaces, et la récupération des producteurs et articles (sous la forme d’entrées). Les fichiers dits “non-structurés” peuvent également être repris avec la fonctionnalité d’édition de Ligeo. Enfin, lors de la reprise des instruments de recherche, une mise à jour vers la norme EAD (Encoded Archival Description) est automatiquement effectuée.
Concernant la reprise de l’indexation, nous pouvons recréer les liens au choix vers les thésaurus officiels du SIAF (http://data.culture.fr/thesaurus/), ou sinon nous créons ex-nihilo les thésaurus avec vos propres termes, répartis par typologie (les lieux, les personnes, etc.)
La reprise de données fait partie intégrante de notre expertise : nous sommes rompus à la reprise de fichiers de toute forme ; tant sur des formats métiers (xml eac, ead, skos, etc.) que sur des fichiers de type Excel ou Word. Notre expertise nous amène aussi à être force de proposition auprès de vos équipes, notamment sur le nettoyage de vos données et le volume à reprendre, en fonction du format des fichiers.
Pour disposer d’une reprise des données “aux petits oignons”, dixit Ludovic Plaçais, chef de produit Ligeo Gestion, il est impératif de préparer en amont vos éléments : notamment en nettoyant les fichiers, et en homogénéisant les données. En effet, ce temps passé à nettoyer les données, sera autant de temps gagné pour le lancement de votre projet de reprise.
La reprise de données avec Ligeo Diffusion
La reprise de données concerne aussi la partie diffusion des archives, principalement lorsque le client n’est pas équipé de Ligeo pour la gestion de ses données !
Reprendre les données de recherche
Concernant ces projets, la reprise porte plus particulièrement sur les données utilisées pour les recherches.
Ligeo Diffusion se “nourrissant” des formats métiers XML/EAD, XML/EAC, et XML/SKOS, il est nécessaire d’exploiter les données de nos clients, pour les structurer dans ces formats.
Pour ce faire, nous disposons d’une boîte à outils, utilisée dans Ligeo Gestion, mais avec une problématique supplémentaire : la gestion des liens vers les ressources numérisées.
En effet, la reprise des images (et autres fichiers sonores, audio, visuels, pdf) est souvent la partie la plus spécifique de la reprise.
Une opportunité pour ré-organiser vos données
Les travaux de reprise sont, là encore, une bonne occasion d’assainir le nommage de vos fichiers, comme le précise Guillaume Lory : “La phase de reprise des données, liée à la migration d’un outil, est souvent une bonne occasion pour travailler l'homogénéisation des données”. En effet, entre les campagnes de numérisation réalisées par différents prestataires, les numérisations manuelles, et la réorganisation effectuée par les services d’archives, nous sommes souvent amenés à proposer un travail d'homogénéisation.
À ces nommages physiques des fichiers, s’ajoute généralement une reprise des liens pérennes au format Ark : un travail de concordance à priori simple, mais qui s'opère sur des millions de fichiers, nécessitant la mise en œuvre d’outil de vérification. “Compte tenu des volumes traités, seule la mise en place d’un outil d’analyse statistique est capable d’assurer le bon déroulement de la reprise. Pour être efficace, un travail de reprise implique également la mise en place de tableaux de bord, afin de suivre le bon avancement des travaux.” souligne Guillaume Lory.
Un de ces outils “de vérification de lien” est d’ailleurs utilisé dans Ligeo Diffusion pour tester l’ensemble des liens (exploitant les balises EAD “dao”) présents dans les fonds. Ligeo vérifie alors que chaque image liée aux documents d’archives est bien présente sur le serveur.
Vous l’aurez compris, la reprise de données est un processus qui se co-construit avec nos clients ! Que ce soit pour Ligeo Gestion ou Diffusion, nous nous adaptons à toutes les spécificités de votre projet.