lundi 6 octobre 2014

Archives en ligne : Les points à améliorer

Dans son dernier numéro, la Revue française de généalogie consacre un article sur les archives en ligne, et propose dix points d'amélioration.  Quels sont-ils ? Peut-on en demander plus ?


La Revue française de généalogie (1), sous la plume de Guillaume de Morant, nous livre un dossier de cinq pages sur les archives en ligne. Quels sont les utilisateurs ? Qu'est-ce qui fonctionne et surtout ce qui ne fonctionne pas.

Guillaume de Morant propose dix points à améliorer. 

Sachant qu'en 2016, le Service Interministériel des Archives de France (SIAF) souhaite lancer un portail national pour les archives en ligne, j'aimerais apporter ma modeste pierre à l'édifice et ouvrir sur ce blog le débat afin que les généalogistes puissent se faire entendre et être partie intégrante dans ce projet.

1. L'adresse

Comme le souligne Guillaume de Morant, l'URL des archives en ligne est  composée au mieux du nom du département et du mot archives ; exemple : archivesenligne.yonne-archives.fr ou archives.cotedor.fr. Malheureusement, ce n'est pas le cas partout, et il arrive que le site d'archives en ligne soit "noyé" dans l'adresse du site du Conseil général qui l'héberge.
Pourquoi ne pas profiter des nouvelles extensions personnalisées rendues possible par l'ICANN et demander l'extension .archives ? L'URL de toutes les archives départementales serait construite sur la base "nom du département.archives"
Y aurait-il une restriction technique empêchant l'utilisation de cette extension ? Si tel n'est pas le cas, pourquoi ne pas envisager cette uniformisation des adresses ?

2. L'information donnée aux usagers / 7. Les instruments de recherche

Avoir une page "Actualités" c'est bien, pouvoir la suivre via une lettre d'information, comme suggérée par GdM, c'est mieux.
Si la mise en place d'une telle lettre d'information implique trop de gestion (mise en pages, gestion des abonnements, ...) pourquoi ne pas mettre en place un flux RSS des actualités du site ?
Bien que cette solution semble évidente, elle est loin d'être appliquée par la majorité des sites.

Tous les sites d'archives en ligne devraient avoir sur leur page d'accueil, et clairement identifiés, l'état général des fonds et l'état des fonds en ligne.

Exemple de présentation des fonds en ligne. AD Maine-et-Loire


Toutefois, une amélioration de l'instrument de recherche, comme demandé en point 7 par GdM, aiderait l'utilisateur.
Cette amélioration passe, selon moi, par la généralisation de la recherche par commune.
En un clic, le chercheur sait à quels fonds en ligne il peut accéder sur une commune donnée.

source AD Yonne

3. Hébergement et gestion du site

Comment informer les usagers d'une panne sur le site ? Guillaume de Morant suggère, à juste titre, qu'un message posté sur les réseaux sociaux ne coûte rien.

Qu'il s'agisse d'archives départementales ou municipales, très peu sont  présentes sur les dis réseaux ; voir à ce titre les recensements effectués par la Revue française de généalogie.
Bien sûr, la généralisation de la présence des archives sur les réseaux sociaux est plus que souhaitable, mais en attendant, il est possible de personnaliser des pages d'erreur (les fameuses pages 404). Un petit message à l'attention des usagers, c'est toujours bien vu.

4. Les logiciels utilisés par les sites / 5. Les permaliens

Sur huit visionneuses utilisées par les archives en ligne, seule une est compatible avec les tablettes (Archinoë).

À l'heure des archives en ligne, de plus en plus de généalogistes se contentent de faire pointer leur logiciel de généalogie vers l'image en ligne. Outre le problème de la pérennité des liens, soulevé en point 5 par Guillaume de Morant, se pose le problème de la visualisation.
Le généalogiste est mobile et la tablette devient le lien avec la famille pour montrer la généalogie. Or visualiser un acte en ligne sur une tablette relève encore de la gageure : qualité de l'affichage, zoom, sélection des informations.

Pourquoi ne pas demander aux archives de mettre en ligne un site qui soit "responsive design", à savoir qui s'adapte à l'écran sur lequel le site est visualisé ? À cela, j'inclue bien sûr la visionneuse.

6. Le partage

"Les archives méritent d'être partagées à un maximum d'internautes". Guillaume de Morant demande que les documents soient accompagnés d'un minimum d'informations. 
Personnellement, j'apprécie les notices du site Gallica :

Gallica


L'inconvénient, toutefois, est que ces informations ne sont pas exportables avec l'image.

Est-il envisageable dès qu'une image est sauvegardée dans le panier  de l'utilisateur, d'inclure les informations de source, cote, date, auteur en tant que métadonnées ?

Faciliter le partage des informations, c'est aussi avoir une politique commune et claire.
Ne serait-il pas temps d'abroger ou d'adopter une licence-clic commune, clairement expliquée et compréhensible par le grand public ?

8. L'ergonomie

Nous revenons sur la qualité de l'accueil abordée en points 2 et 7. Un site, quel qu'il soit, se doit de penser à tout le monde. Tous les visiteurs ne sont pas archivistes et n'ont donc pas la logique du classement archivistique pour trouver un document. Tous les visiteurs ne sont pas des généalogistes aguerris qui savent quel document rechercher et où. Il faut penser aux débutants.

Le site des archives de l'Aube est intéressant. Il propose un accès en deux temps. 
Une première page présentant les fonds en ligne :


Une page dédiée à la généalogie et aux premiers fonds qui intéresseront le généalogiste.



9. Les fonds et données numérisées

94 % des visiteurs déclarent consulter un site d'archives en ligne pour une recherche généalogique. Pourquoi dans ce cas, certains départements s'évertuent à mettre d'abord en ligne des cartes postales ou le cadastre ? Ce ne sont pas les premiers fonds que recherchent les généalogistes. 96 % d'entre eux consultent en priorité les registres paroissiaux et l'état civil.
À terme, tous les documents sont susceptibles d'intéresser le généalogiste. Toutefois, au vu des résultats de l'enquête publiée par les Archives de France, il apparaît comme une évidence que tous les départements doivent mettre en priorité sur leur site l'état-civil numérisé. 

10. Pratiques collaboratives

Le dernier point aborde l'enjeu que représente l'indexation des données présentes dans les fonds des archives.
Si les archives veulent attirer un maximum de bénévoles, je pense qu'elles doivent revoir leur façon de penser l'indexation en proposant des niveaux progressifs et des lots allégés.
Je vais prendre comme exemple, l'indexation collaborative aux archives de l'Yonne.
J'ai choisi de participer à l'indexation des fiches matricules. Les lots à indexer sont inégaux. Les plus petits sont les premiers partis. Ayant pris le train en marche, je me retrouve avec un lot de 900 vues à visionner et indexer. Bien sûr, j'ai jusqu'en janvier 2015 avec possibilité de prolongation pour le faire. Malgré ma bonne volonté, j'ai eu un moment de recul face au volume du lot. Combien ont abandonné ? 

Pour indexer l'état-civil et les registres paroissiaux, un des deux textes soumis dans le test de validation est un texte du 18e siècle qui sera difficile à transcrire pour un débutant. 

Pourquoi décourager les bonnes volontés avec des volumes et des écrits qui nécessitent du temps et/ou une certaine expérience ?
Ne serait-il pas plus judicieux de laisser le choix au bénévole et de vérifier son niveau selon la période choisie ? Vous voulez indexer un lot d'état-civil du 19e siècle ? Nous vous testons sur les écrits de cette période. Vous vous proposez pour des registres paroissiaux du 17e siècle ? Le test porte sur cette période.
C'est en accompagnant les bénévoles dans l'indexation par des tests et des volumes de lots adaptés, que la pratique collaborative a le plus de chances de se développer. 

Enfin, pour conclure ce billet sur les améliorations à apporter aux sites d'archives en ligne, je vous conseille de lire un échange en date du 12 septembre 2014 qui s'est tenu entre plusieurs généalogistes sur Twitter (lien).

Brigitte nous faisait part d'un rêve :


Et si le portail envisagé par le SIAF devenait un super-portail avec un moteur recherchant dans toutes les bases, y compris celles des associations ?




(1) La Revue française de généalogie, n°214 oct-nov 2014, L'enquête vérité sur les archives en ligne, pages 13 - 17.

12 commentaires :

Article à relayer largement .... Je suis complètement d'accord avec tous ces points. Quand on arrive sur un nouveau site départemental qu'on ne connait pas, on est toujours perdu, aucun département ne fonctionne de la même façon ... Espérons que tout cela ne sera pas juste un rêve un jour :)

Merci Brigitte. J'espère que les généalogistes auront leur mot à dire et qu'une véritable concertation entre les producteurs - services d'archives - et les utilisateurs - généalogistes - se mettra en place.

Merci Dominique ! Trouver une données dans un site d'archives en ligne ressemble parfois à un puzzle ;-)

Bon je vais prêcher un peu pour ma paroisse.

1. Le nom de domaine, ok c'est parfois assez exotique. Mais en deux clics (Google, favori), il est quand même facile d'avoir en résultat de recherche de "archives + nom de département" le site recherché - ce que font les gens pour accéder à n'importe quel contenu sur Internet en fait ; rare sont ceux qui saisissent une url directe, et même s'ils le font, avec un navigateur à jour, leur recherche est redirigée dans le moteur de recherche par défaut. Atterir sur la page / le site d'archives municipales est un peu plus "compliqué". Nombreux sont ceux qui parlent d'ailleurs d'Archives départementales du chef-lieu, au lieu du département. Y compris dans des numéros spéciaux généalogie...
Ne pas ignorer non plus que lorsque le service d'archives doit se "contenter" de pages spécifiques sur un site de conseil général, il l'a rarement demandé. Budget restreint oblige, les collectivités ont souvent drastiquement réduit les dizaines de sites Internet satellitaires pour lequel il faut payer nom de domaine, hébergement, presta, etc... Les archives ont plus souvent un sous-domaine de site de conseil général qu'un nom de domaine perso.
Quant au .archives à l'ICANN, mouais, démarche un peu longue pour un résultat qui serait bien franco-français et concernerait une centaine de sites Internet à tout casser.

2. L'information / les instruments de recherche en ligne. Comme dans n'importe quelle profession, il y a plusieurs religions parmi les archivistes, des évolutions dans les pratiques (des internautes et des archivistes), des moyens financiers et une expérience du web différents. A ceux qui pestent contre les AD22 par exemple, oui c'est... insupportable, mais quand on sait qu'ils ont un budget ridicule et qu'ils ont été parmi les premiers en ligne, j'ai quand même envie de dire chapeau.
Certains axent leur portail sur les ressources numérisées, d'autres sur les dossiers docs, d'autres sont à fond instruments de recherche en ligne. Et cela évolue : une fois le gros chantier de mise en ligne de l'état civil effectué, on peut tâcher de redispatcher les forces vives sur les instruments de recherche électronique.

4. Les logiciels utilisés par les sites.
Le responsive design et le HTML5, ça a quoi, même pas 3 ans, et encore, moins si on doit recourir à des développements de prestataires à des prix raisonnables (et au début, c'était loin de l'être !!!). La création d'un portail in extenso, de la rédaction du cahier des charges à la mise en ligne, ça prend plusieurs mois (pour ne pas dire plus d'un an). Une fois abouti, il est impossible de rebondir sur la dernière évolution web du jour pour l'intégrer. Gérer le site d'un service, ça n'a rien à voir avec gérer un site perso : derrière il y a des validations à obtenir, des exigences hiérarchiques, des chartes graphiques à respecter, auxquelle s'ajoute le temps administratif... Bien sûr que je suis pour les sites responsive design - enfin pour des sites "modernes" tout court - mais je serai déjà contente le jour où les sites en 800x600 ou les look cheap 90s auront disparu de mon écran.
Pour les actualités, ce n'est pas nécessairement un flux RSS - tout sauf grand public - qu'il faut promouvoir (même s'il doit exister), mais un abonnement mail par flux RSS (de type Email subscription de Wordpress ou Feedburner). Moi ce qui me chatouille sur les sites d'archives en général, c'est l'absence de recherche dans le contenu éditorial souvent riche, peu ou mal référencé, peu ou mal valorisé (vive les fichiers PDF dans tous les sens) et cette peur que "les gens confondent la recherche dans le site avec la recherche dans les inventaires". Sauf que les gens ont l'habitude de naviguer sur des sites Internet AVEC moteur de recherche interne, et qu'il est possible de faire une recherche transversale (cf archives.vendee.fr).
La recherche par commune, mille fois oui ; mais derrière, cela signifie existence d'inventaires électroniques avec fonds indexés au nom de la commune. Or en matière d'indexation (et d'inventaires électroniques) la situation des services d'archives est encore plus diverse qu'en matière de sites d'archives, avec là encore une contrainte technique le logiciel de gestion. Faire une recherche dans tous les fonds pour pouvoir indexer en masse, j'en rêve tous les jours...
Petite précision, Archinoe n'est pas la seule compatible tablettes. Ligeo, Mnesys le sont aussi. Bref tout dépend de la version du visualiseur (pour avoir la dernière version d'un visualiseur, il faut accessoirement payer) du type de tablette et de la version du système d'exploitation. La tablette pour aller en lien direct sur un acte pourquoi pas, mais pour faire des recherches hum...

8. Ah l'ergonomie... question infinie, et compliquée : comment répondre à tous les publics, aux habitudes des aguerris de l'informatique, des archives, de la recherche et à ceux qui le sont moins. Par contre j'avoue que les AD de l'Aube, ça se veut beau et tout, mais personnellement je n'ai jamais compris comment ça fonctionnait et j'ai toujours été déçue du contenu au bout des clics.

Et pour conclure, ce que j'ai déjà dit sur Twitter notamment : les méga bases, c'est dépassé et usine à gaz. Ce qu'il faut, c'est de l'interopérabilité pour qu'un méta moteur viennent moissonner différentes bases (ce que fait Europeana ou culture.fr). Donc il faut des inventaires électroniques indexés, normalisés et penser ouverture.

Merci Maïwenn pour tes remarques. C'est ce que je souhaite, se faire rencontrer les points de vue des utilisateurs et les possibilités des services d'archives.
Tout n'est pas conciliable, mais il faut pouvoir s'expliquer.

Concernant l'URL, une fois trouvée, je l'enregistre dans mes favoris. Je suis consciente que le .archives, s'il n'émane pas une réelle volonté internationale sur le sujet, restera un doux rêve. Mais il s'agit ici de propositions, on peut donc rêver ;-)

Le souci que je tiens à souligner dans l'article est un problème très français, on met en branle tout un système, et une fois que tout est lancé, on s'interroge sur l'intérêt, les fonctionnalités, ...
Oui, il y a la pression du public, mais en communiquant correctement, c'est payant de prendre le temps de l'analyse et de la conception.

Je te rejoins sur le point de l'ouverture, d'ailleurs lorsque je parle d'un super-portail avec un super moteur de recherche, je pense à un "Google de la généalogie" ; un moteur qui ira chercher dans toutes les bases indexées, que ce soient celles des archives ou des associations. Certaines associations font un travail formidable qu'il faut mettre en avant.

En résumé, il faut que le dialogue s'installe et que les parties prenantes comprennent les envies et contraintes de chacun pour avancer dans le bon sens.

Si la recherche est trop simple, que deviendra le plaisir de chercher ? ;-)

Aux associations généalogiques d'envisager un format ouvert et moissonnable (quitte à ce qu'il y ait des données payantes) : c'est ce qu'ont fait certaines asso culturelles pour Bretania.bzh .
Sur les usages, le "problème" est qu'ils sont très divers. Certains ont l'habitude du web, d'autres non, certains savent chercher, d'autres non. Et même au sein d'un groupe qu'on pourrait croire habituer, les pratiques selon l'âge, le milieu, la culture numérique, sont très diverses. Sans compter les évolutions extrêmement rapides des innovations, et l'équipement matériel des uns et des autres.
En dehors du problème "très français", je pense que toute façon l'administration est plus lente à faire bouger que les particuliers, qui ont comme souvent un train d'avance. L'irruption du numérique fait que le public / les citoyens se retrouvent avec des applications / fonctionnements pensés avec les moyens du bord par des personnes qui n'en ont pas forcément l'usage et qui ne voient pas les aboutissants. Mais c'est en train de changer :-) (on doit rêver !)

Sans être informaticien, il me semble que dès lors que l'on est propriétaire du nom de domaine (mondomaine.fr), il est tout-à-fait possible de prévoir des sous-domaines (par exemple forum.mondomaine.fr, blog.mondomaine.fr). www est d'ailleurs lui-même considéré comme sous-domaine

Au sujet de l'indexation, plutôt que de demander au volontaire d'indexer toute une liasse de documents, je préfère la méthode de l'indexation "à la carte" mise en place aux AD du Rhône : indexation collaborative des noms et prénoms, dans les registres de l'état civil et du recensement. On peut indexer juste le nom que l'on est venu chercher, tous les noms d'une page, ou pourquoi pas si on est motivé, tout un registre. Cf le mode d'emploi ici : http://archives.rhone.fr/download.cgi?filename=accounts/mnesys_cg69/datas/cms/indexation.pdf

Je ne sais pas si je suis hors sujet mais pour ma part alors que j'utilise Heredis pour ma généalogie, j'utilise une version de base de Geneatique qui me permet d'accéder directement à la liste de toutes les AD en ligne comme sur la carte des AD de Guillaume de Morant, je peux sélectionner le document qui m'intéresse, l'enregistrer et l'intégrer à mon logiciel de généalogie. C'est très rapide.
Je regrette qu'Heredis n'ait pas cette fonction.

Enregistrer un commentaire