mardi 10 mars 2015

Réunion des utilisateurs du Projet "Correct - Bnf" : Saint-George & Dalayrac ont participé


Compte rendu
Réunion
avec les représentants
du "Réseau-Correct"
17 Février 2015
Bibliothèque nationale de France.


 
Rédigé par :
Alexis Marise Bique & Antoine Caumel
Membres de la Société d'histoire 94120 Saint-George & Dalayrac

1. Présentation de Correct

Depuis janvier 2012, La BnF participe au projet de recherche FUI12 Ozalid dont l’objectif est la conception et le développement de la plate-forme de crowdsourcing CORRECT (correction et enrichissement collaboratifs de texte). Ce projet réunit 9 partenaires  : Orange, BnF, Jamespot, Urbilog, I2S, ISEP, INSA Lyon, Université Lyon 1, Université Paris 8. 
Fin 2014, Correct a été ouverte au public ; parallèlement, le Bureau Van Dijk a été chargé d’étudier les usages des premiers utilisateurs bénévoles et récolter leurs impressions et suggestions. C’était l’objet de la réunion à laquelle nous avons assisté le 17 février 2015.

2.- Informations utiles recueillies durant la réunion

2.1 - Les différences avec Wikisource

  • Les formats
  • Les jeux de caractères
  • La correction caractère par caractère,
  • Interopérabilité.
  • Correction en ligne visuellement distincte de la correction par page

2.2 - Aspects techniques incompatibles

Une page de Wikisource
avant modification manuelle
Deux aspects techniques, l’indexation et la géolocalisation des mots dans les textes, « ont concouru à mettre fin au projet BnF – Wikisource ».

"...le format DjVu utilisé par Wikisource ne contient pas d’informations de structure comme le format ALTO utilisé par Gallica (nécessaire à la mise en œuvre des fonctionnalités de recherche et de navigation dans les documents), et les fichiers corrigés ne peuvent donc pas être réintégrés automatiquement."

Etat de l'art en matière de crowdsourcing dans les bibliothèques numériques, p. 17 =>

3.- Quel intérêt pour Wikisource et projets liés ?

En participant à cette réunion, notre objectif était de suivre l’évolution de la politique des pouvoirs publics afin de comparer les stratégies en connaissance de cause. Ainsi, pour comprendre dans quel contexte Correct prend place, il faut se remémorer les péripéties par lesquelles a passé la BnF s’agissant de la numérisation de ses collections. Se référer, par exemple, à : 
Notre attention a été attirée sur l'état de la recherche à propos de la reconnaissance des caractères et la reproduction des caractères anciens afin de mieux localiser les caractères aussi bien que les mots dans les textes.

3.1 – Questions pour wikisource

Gyzis 006 (Ηistoria)
Nikolaos Gyzis (1842–1901)
Historia, 1892
A l'issue de cet entretien de recherche, il nous est apparu nécessaire de renforcer les réseaux autour de Wikisource et projets liés. De mieux connaître les personnes qui œuvrent dans ce champ d'innovation, de manifester notre présence et notre investissement.
Deux questions majeures se posent, à notre avis, pour lesquelles nous n'avons pas de réponses.
  • Es-t-il possible d'opter pour un format autre que Djvu pour aller vers plus d'interopérabilité
  • Le projet Wikisource est-il en mesure de concevoir des solutions issues du Libre, en formats interopérables, allant dans le sens d’une reconnaissance et d’une collaboration. Par exemple en travaillant avec OpenStreetMap à la localisation des mots dans Wikisource.

4.- Webgraphie

La plateforme Correct
Communications autour du projet

Quelques liens pour comprendre l’évolution de la politique de la BnF :

2009, partenariat BnF et Google, articles de presse
Crowdsourcing et plateformes collaboratives : Documents produits pour la BnF