Hackathon BnF, édition 2016 : l'heure du bilan !
Après 24h de remue-méninges et de travail intensifs, c'est finalement Gallicarte qui a remporté le prix du hackathon BnF 2016. Le projet, qui sera développé, sous licence libre, par la BnF, permettra d'explorer les collections de Gallica sur cartes. Rendez-vous est déjà pris pour renouveler l’expérience l’année prochaine.
Gallicarte, lauréat du premier Prix du hackathon BnF ©David-Paul Carr/BnF
Pour l’heure, le blog Gallica vous propose de revenir sur cette édition en compagnie de trois experts : Christophe Noisel, ingénieur, membre du jury du hackathon BnF 2016, Jean-Philippe Moreux, chef de projet OCR et formats éditoriaux à la BnF, et Stéphane Pillorget, responsable du bureau conception et développement de la Bibliothèque.
Qu'avez-vous pensé de cette première édition du hackathon BnF ?
Stéphane Pillorget : J'ai trouvé cette première édition passionnante ! Après le BarCamp de préparation, début novembre, j'étais un peu inquiet quant à la capacité des futurs hackathoniens à trouver des idées novatrices, permettant de fédérer une communauté, de créer du lien entre nos applications et le reste du web. Le challenge technique était également très important : comment les hackathoniens allaient-ils s'y retrouver, en moins de 24h, pour comprendre les multiples API (Application Programing Interface) développées par les équipes informatiques depuis tant d'années ? Etait-il vraiment raisonnable de leur demander en 24h de trouver et de prototyper une idée ?
Et puis… Ils sont arrivés, ont échangé et se sont regroupés par affinité autour d'une idée avant de commencer sa réalisation. En une heure et demie, l'intelligence collective de chacun des groupes était à l’œuvre et j'ai rapidement compris que c'était gagné... Bien assistés par les "référents-volontaires" de la BnF, ils ont pu aller, pour la plupart, jusqu'au bout de leur idée, jusqu'à un prototype opérationnel. J'avoue que les rendus intermédiaires des équipes étaient également assez impressionnants !
Du point de vue de l'informaticien, c'était vraiment très grisant de constater la facilité avec laquelle ils utilisaient nos services pour construire leurs idées ; et, du point de vue de l'agent BnF, c'était également très agréable de partager l'aventure avec des collègues de métiers différents, de les découvrir sous un autre angle, de sortir un peu du cadre et de sentir comme l'appartenance à la Bibliothèque était forte. C'était un week-end très "corporate"… J'étais vraiment heureux d'être là et de partager ce moment avec mes collègues.
Christophe Noisel : Le hackathon s’est très bien déroulé, je dois dire que j’étais très curieux de découvrir comment cela allait se passer, ayant l’habitude d’événements beaucoup moins formels ! Je comptais initialement faire partie des compétiteurs, et je me suis finalement retrouvé à la table du jury, non sans un certain amusement. Je félicite la BnF pour cette réussite ! Merci à l’équipe sur le terrain qui a été très accueillante tout au long du week-end, malgré les horaires nocturnes.
La constitution des équipes était très intéressante : une bonne mixité homme/femme ainsi que des compétences hétérogènes, ce qui n’est pas forcément le cas de tous les hackathons liés au numérique, où l’on peut vite tomber dans l’entre-soi. C’est un point qui a tout intérêt à être souligné pour la prochaine édition.
Je pense que la BnF peut prétendre à faire un hackathon de plus de 24h. Non seulement les projets pourront être encore plus ambitieux (et mettre davantage à profit l’espace de prototypage ?), mais cela donnera plus de temps aux équipes pour intégrer l’avis intermédiaire du jury.
Jean-Philippe Moreux : J'ai le sentiment de partager l'impression générale, à savoir une réussite enthousiasmante ! On pourrait penser à quelques points d'amélioration, mais la participation et l'implication de tous se sont révélées exemplaires. J'ai été particulièrement impressionné par le fait qu'un groupe de 60 personnes aura réussi à s'organiser en 8 équipes en une heure ! Autre point remarquable, en effet, la mixité des participants : parité homme/femme, développeur/non développeur. Ce dernier point aura d'ailleurs joué des tours à certains projets, qui ont manqué de force vive pour le codage !
La pertinence et la diversité des projets présentés par les hackathoniens auront marqué tous les agents BnF, me semble-t-il. Certains participants sont mêmes venus avec plusieurs idées de projets en tête ! Enfin, plusieurs des sujets et thématiques faisaient écho à nos propres préoccupations. Je pense en particulier aux entités nommées, à la géolocalisation ou encore à la recherche d'images dans les corpus imprimés.
Les collections de Gallica ont-elles inspiré les hackathoniens ? Autour de quelles questions ?
Stéphane Pillorget : La plupart des projets, en particulier les plus aboutis d’entre eux, ont largement été inspirés par les collections de Gallica. Que ce soit Gallicalol qui utilise l’incroyable fonds d’images de Gallica pour proposer de les enrichir par des textes avant de les publier, le projet vainqueur, Gallicarte, qui propose une représentation cartographique des résultats d’une recherche, ou encore le projet QuediraitDiderot, qui utilise la capacité de chercher dans le texte des documents de Gallica pour proposer des réactions humoristiques au Trending Topics (hashtags les plus fréquemment utilisés) de Twitter, les fonds de Gallica étaient vraiment au centre de ce hackathon ce week-end.
Christophe Noisel : Assurément, les fonds numérisés ont suscité un vif intérêt des hackathoniens, ce qui n’est pas surprenant : il y avait de nombreux usagers de Gallica ravis de pouvoir apporter leur pierre à l'édifice. Le spectre d’application était assez large : de l’enrichissement sémantique de la base de données à l’utilisation plus divertissante sur les réseaux sociaux. Il a rapidement semblé évident au jury qu’il serait souhaitable, après le hackathon, d’aider à l’épanouissement de certains autres projets, outre le lauréat. Gallicalol ou QuediraitDiderot ont définitivement marqué les esprits et sont les mieux placés, je pense, pour toucher un nouveau public.
Parmi les projets présentés, y en a-t-il un qui vous a particulièrement intéressés ?
Jean-Philippe Moreux : J'ai conseillé plusieurs projets lors des premières heures sur des thèmes qui sont au cœur de mon activité professionnelle : OCR et enrichissement des documents numériques (entités nommées, structuration logique). Mais les projets visant à pousser les contenus de Gallica sur les réseaux sociaux (recommandations de lecture, extraits d'œuvres, etc.) auront également été passionnants à suivre… puis à tester grâce aux démonstrateurs !
Christophe Noisel : J’ai de la chance, car mon projet favori est également le gagnant, mais j’aimerais parler aussi de Mine par l’équipe Reden (second dans mon classement), qui permet de faire de la fouille de texte (extraction d'entités nommées et désambiguïsation) sur les données de data.bnf.fr. Bien que l’objet d’étude ne soit pas le mien et que l’outil soit très orienté recherche au premier abord, les travaux de cette équipe m’ont donné envie de voir leur système fonctionner. Sa communication très claire sur les technologies utilisées donne confiance sur le sérieux de sa démarche.
Stéphane Pillorget : J’ai été vraiment très intéressé par les différents projets mais j’avoue avoir eu un faible pour QuediraitDiderot. Les raisons en sont multiples : il s’agit d’abord de raccrocher à une actualité extrêmement fluctuante des textes qui, étant essentiellement dans le domaine public, ont plusieurs dizaines voire centaines d’années… L’idée de pouvoir valoriser les fonds de Gallica et "d’attraper" le grand public là où il se trouve, de façon quasi automatique, pour lui faire découvrir Gallica, était également très séduisante. J’ai aussi été très impressionné par le résultat obtenu du prototype en moins de 24 h… Que de sourires dans cette sympathique équipe qui mêlait humour, impertinence et communication parfaite pendant les présentations !
Qu'avez-vous pensé du projet primé ?
Stéphane Pillorget : Gallicarte va beaucoup apporter aux internautes qui consultent Gallica. Réussir à offrir une représentation cartographique des résultats sera un véritable plus pour un certain nombre d’utilisateurs qui peuvent être un peu perdus par les foisonnantes listes de résultats du moteur. La conception de ce module de visualisation qui mixte les métadonnées présentes dans le fonds Gallica et celles, très riches, présentes dans l’entrepôt de données data.bnf.fr est également très intéressante d’un point de vue technique. Enfin, ce projet est complètement en phase avec les travaux actuellement en cours sur l’identification d’entités nommées (ville, personne, organisation) qui permettront d’enrichir, encore, ces représentations cartographiques.
Jean-Philippe Moreux : Gallicarte est une très belle réussite. Il conjugue plusieurs qualités : clarté de l'objectif, prototype opérationnel et documenté. C'est également un projet dont l'esprit pourrait être repris directement dans Gallica, puisqu'il valorise des métadonnées que la BnF a produites mais qui ne sont actuellement pas proposées à nos utilisateurs.
Christophe Noisel : Le projet Gallicarte a immédiatement attiré mon attention car j’ai eu à réfléchir sur une problématique identique il y a un an. L’écriture d’un plugin navigateur ajoutant directement les fonctionnalités sur Gallica était bien trouvée et, surtout, constituait parfaitement le hack transgressif attendu dans ce genre d’événement : le site est détourné de son usage officiel par l’individu qui obtient un nouvel outil. Gallicarte a également fait partie des équipes qui ont su mettre très rapidement en œuvre leurs idées : dans la soirée, l’interface de Gallica était déjà modifiée ! Enfin, le projet s’adressait à tous les publics : même hors du jury, il semble avoir récolté énormément de suffrages.
De quelle manière allez-vous réutiliser certaines des idées de ce hackathon dans votre travail ou vos projets futurs ?
Stéphane Pillorget : La BnF s’est engagée à finir de réaliser et à industrialiser le prototype primé avant de le mettre en ligne. Ce sujet va donc largement m’occuper en 2017, tout comme les équipes de réalisation qui étaient présentes pendant le hackathon. Plusieurs autres projets sont déjà suffisamment aboutis pour que l’on puisse envisager de les proposer à court terme comme services connexes de Gallica. J’aurai également à travailler en ce sens... et je m'en félicite !
Christophe Noisel : Les API mises à disposition par la BnF sont nombreuses (j’en compte 7 sur la documentation du hackathon) et malheureusement très cryptiques pour les personnes techniques comme moi qui ont peu d’éducation sur les méthodes et protocoles spécifiques au domaine de la culture. Les projets du hackathon étant publiquement mis à disposition, ils constituent une ressource très précieuse pour démarrer d’autres projets. La BnF pourrait pérenniser cette opportunité en proposant une documentation autour de ces exemples clefs en main et en assurant leurs mises à jour avec l’évolution de leurs outils. C’est un point essentiel de la diffusion de ces ressources à un public plus large. Si la BnF s’investissait sur une plate-forme d’échange en jouant la transparence, elle pourrait même trouver des collaborateurs inattendus.
Jean-Philippe Moreux : Ce hackathon est une invitation à réaliser "en grand" certains des projets (outre le projet primé). Mais également, comme le pointe Christophe, à poursuivre l'ouverture de nos données et de nos API, notamment en les documentant. Ce qui facilitera l'exercice des hackathoniens lors de la prochaine session, mais surtout suscitera d'autres vocations de remédiation de nos collections numériques tout au long de l'année, entre deux hackathons ! Enfin, la qualité des réalisations (et la rapidité de leur développement) sera certainement un aiguillon pour nos propres actions de prototypage. La barre étant désormais très haute !
Le premier hackathon de la BnF : une aventure collective ! ©David-Paul Carr/BnF