×

Ce site est un chantier à ciel ouvert habité par les éditeurs, lecteurs, auteurs, techniciens, designers de Sens public. Il s'agence et s'aménage au fil de l'eau. Explorez et prenez vos marques (mode d'emploi ici) !

Du Poste de Lecture Assistée par Ordinateur (P.L.A.O.) au schéma numérique

Trois étapes de la re-médiation de la BnF

Informations
  • Résumé
  • Mots-clés (14)
      • Mot-clésFR Éditeur 1 article 1 dossier,  
        1 article 1 dossier,  
        Mot-clésFR Auteur 2 articles
        2 articles
        Mot-clésEN Auteur 5 articles 1 dossier,  
        5 articles 1 dossier,  
        Mot-clésEN Auteur 2 articles
        2 articles
        Mot-clésEN Auteur 1 article
        1 article
        Mot-clésFR Auteur 5 articles 1 dossier,  
        5 articles 1 dossier,  
        Mot-clésFR Éditeur 1 article
        1 article
        Mot-clésFR Éditeur 1 article
        1 article
        Mot-clésFR Auteur 1 article
        1 article
        Mot-clésFR Éditeur 1 article
        1 article
        Mot-clésEN Auteur 1 article
        1 article
        Mot-clésFR Auteur 1 article
        1 article
        Mot-clésFR Auteur 3 articles 1 dossier,  
        3 articles 1 dossier,  
        Mot-clésEN Auteur 1 article
        1 article
      Texte

      Introduction : la numérisation comme remédiation

      On définit parfois une « bibliothèque numérique », au sens étroit (ex. Borgman (1999), Da Sylva (2013)), comme une collection de documents numérisés ou nativement numériques – principalement textuels, mais également audiovisuels –, structurée en une base de données indexée et assortie d’un service de mise à disposition de ces documents sur une plateforme dédiée munie d’outils de recherche – essentiellement des moteurs de recherche, mais également des systèmes de recommandation humaine ou algorithmique – et de consultation – sur une liseuse en ligne ou bien par téléchargement.

      Cette étroite définition est à mettre en regard de celle de « bibliothèque », qui rassemble et articule de nombreuses dimensions :

      • Un ensemble documentaire structuré, résultant de politiques de sélection, de conservation, d’organisation par fonds et collections, d’indexation par catalogage, de documentation des documents par notices… (Bermes 2020) ;
      • Une infrastructure, entendue en un sens large comme l’ensemble des conditions matérielles de possibilité de conservation, de structuration et de consultation de cet ensemble documentaire (magasins, catalogues, prêt, salles de lecture, transport automatisé de documents…) et dont l’action efficace, hors dysfonctionnement, ambitionne d’être silencieuse et invisible (Borgman 2000, 2007) ;
      • Une organisation comme structure sociale professionnelle dédiée au fonctionnement des services et missions, composée d’agent·es détenteur·ices de compétences spécifiques et distribué·es en départements (Béquet 2014) ;
      • Parfois également une institution culturelle et/ou scientifique, c’est-à-dire une organisation dont l’échelle et la longévité lui assurent une relative stabilité (inertie, pérennité) lui permettant, d’une part, d’être reconnue comme telle par ses communautés et, d’autre part, de réguler et normaliser les usages des objets qu’elle conserve (conventions) en appliquant sa marque symbolique dessus (Blasselle et Toscano 2021) ;
      • Des espaces de sociabilités, dans et hors les murs de l’enceinte physique, permettant à des communautés d’usager·es de se former et de se rencontrer autour de pratiques et d’intérêts communs (Le Marec 2021; Bert-Erboul, Fayet, et Wiart 2022) ;
      • Des lieux d’exposition permettant de valoriser les collections de la bibliothèque autour de thématiques choisies, de dispositifs spécifiques de médiation et à destination des communautés et au-delà (Payen 2022) ;
      • Une démonstration architecturale (Roquet 2016) ;

      De la « bibliothèque » à la « bibliothèque numérique », certaines dimensions sont ainsi amplifiées, d’autres sont minimisées, jusqu’à parfois les invisibiliser, d’autres encore sont spécifiques au « physique » ou au numérique (Boullier 2016). En effet, si l’on envisage la numérisation, non comme simple conversion d’un document du format papier au format numérique, mais entendue au sens large comme opération de remédiation des documents, des espaces, des services et des organisations de la bibliothèque, l’on voit d’emblée que celle-ci isole et agit différemment sur chacune des dimensions de la bibliothèque.

      La remédiation1 de la bibliothèque en bibliothèque numérique sélectionne, amplifie, invisibilise des objets, des pratiques, des compétences, mais également les fragmente, les (re)combine, les redistribue ou en crée de nouveaux. Si, aujourd’hui, Gallica est principalement la remédiation numérique d’un ensemble documentaire hérité de la bibliothèque historique (ayant à nouveau fait l’objet de politiques de sélection) et d’une infrastructure de services (qui repose sur le système d’information de la bibliothèque physique), l’histoire récente de la BnF, avant et après Gallica, montre que la plateforme n’est pas la seule remédiation possible et envisagée de la bibliothèque dans toute son épaisseur historico-culturelle et sa complexité socio-anthropologique.

      La présente contribution ne prétend aucunement participer de l’écriture de l’histoire de la numérisation de la BnF. Il s’agit plutôt d’une réflexion qui envisage sous le prisme de la remédiation deux ou trois choses que je sais du fonctionnement de Gallica et de son histoire au sein de la BnF. J’aurais donc notamment recours aux riches travaux de Gaëlle Béquet (2014) et d’Emmanuelle Bermès (2020; 2023) sur l’histoire de l’arrivée du numérique et d’Internet à la BnF. Je m’appuierai également sur mes propres travaux ethnographiques sur les pratiques de navigation au sein de Gallica (Dumas Primbault 2023) et sur la notion d’écosystème (Mounier et Dumas Primbault 2023; Dumas Primbault 2025).

      En trois temps, nous nous pencherons sur trois épisodes de l’histoire du numérique à la BnF :

      1. La brève histoire du Poste de lecture assistée par ordinateur (P.L.A.O.) durant les années 1990 atteste, dans le projet de modernisation de la BnF, d’une tentative de remédier les pratiques savantes, rendue patente par un texte de Bernard Stiegler, alors « grand lecteur » pour le projet ;
      2. La naissance de Gallica, consécutive à l’abandon du P.L.A.O. et à l’arrivée d’Internet dans l’institution, marque, en particulier avec les politiques engagées par Jean-Noël Jeanneney au mitan des années 2000, la remédiation de la bibliothèque comme numérisation de ses collections ;
      3. Le schéma numérique de 2020, qui voit se surajouter la problématique des données à celle du numérique en réseau, illustre, sous la forme d’une cartographie métaphorique, l’actuelle omniprésence du numérique à la BnF et l’ouverture d’un tiers espace de la donnée propice à la circulation présumée sans friction d’unités asémantiques affranchies des logiques de collection.

      Ces trois épisodes n’épuisent évidemment pas l’histoire de la numérisation de la BnF – entendue au sens large comme l’ensemble des processus de transformation et de reconfiguration amenés par le numérique sous toutes ses formes. Ils représentent cependant un découpage tout à la fois historique (que l’on retrouve chez Béquet (2014) et Bermes (2020)) et médiatique pertinent pour saisir cette histoire en une suite de tableaux emblématiques – avec, d’abord, l’arrivée du numérique comme format d’encodage, puis d’Internet comme infrastructure réticulaire de communication, puis des données comme espace de mise en équivalence. Ces trois épisodes attestent en effet des changements d’objet de la numérisation – des pratiques aux ouvrages, puis à tout l’environnement de travail –, des conséquences de la numérisation sur la définition des mandats et de l’identité de la bibliothèque – tour à tour patrimoniale, de recherche, encyclopédique, accessible au public – et, enfin, de l’emprise croissante du numérique sur l’institution. S’il ne s’agit donc pas à proprement parler d’analyses de cas, l’aspect diachronique de cette analyse média-historique (Dumas Primbault 2022) permet de saisir par contraste les problématiques sociotechniques et épistémologiques de la remédiation par le numérique à la BnF autant que de remettre en question la notion même de remédiation.

      En guise de conclusion, nous verrons comment, du « démembrement des volumes » au temps du P.L.A.O., à la « délinéarisation » des documents par l’hypertexte, au « désilotage » des collections par la donnée, les étapes successives de la remédiation numérique de la BnF annoncent toujours l’avènement d’un nouvel ordre numérique du savoir sous le signe de l’abolition des structures passées, une table rase éternellement repoussée qui peine encore à se montrer dans les pratiques.

      La bibliothèque numérique comme outil

      Le P.L.A.O. : une autre histoire de la numérisation

      Si Gallica se présente comme une plateforme de consultation de documents numérisés, la remédiation de la BnF n’a pas toujours été envisagée comme la numérisation d’objets documentaires et la plateformisation de leur accès. Cet état de fait, qui dépend de choix politiques et culturels, d’un contexte sociotechnique, d’une dynamique administrative, fut précédé, avant l’irruption d’Internet, par un projet de Poste de lecture assistée par ordinateur (P.L.A.O.) – qui avait pour ambition de remédier toutes les opérations intellectuelles que l’on pouvait effectuer sur et autour d’un document consulté en bibliothèque : copie, prise de note, travail bibliographique…

      Le 14 juillet 1988, un an avant le bicentenaire de la Révolution française, François Mitterrand annonce publiquement la création, dans le cadre de ses Grand Travaux, d’une « Très Grande Bibliothèque », projet encyclopédique et parangon de modernité qui doit mettre à profit les progrès récents de l’informatique et des réseaux de télécommunication. En novembre de la même année, un rapport rédigé par Patrice Cahart et Michel Melot fait mention du P.L.A.O. pour la première fois : il s’agira d’un poste physique accessible dans les bâtiments de la bibliothèque et permettant de consulter, grâce à des logiciels dédiés, des documents électroniques numérisés (Richard 1993).

      À la création – parallèlement à l’historique Bibliothèque nationale (Bn) jugée alors « trop exiguë et saturée » (Gattégno 1991) – de l’Établissement public de la Bibliothèque de France (EPBF) en 1989, un groupe de travail, principalement constitué d’ingénieurs informaticiens, est formé pour réfléchir au P.L.A.O. Ce dernier devient rapidement un projet « vitrine » pour le système d’information naissant, car il incarne à la fois les idéaux patrimoniaux de la bibliothèque, son projet encyclopédique et les avancées technologiques qui portent ceux-ci (Béquet 2014). Une première étude de marché est réalisée visant à confronter les solutions existantes avec les pratiques de lecture réelles. Ainsi, afin d’ancrer le projet dans les besoins des chercheur·euses professionnel·les, un groupe de neuf « grands lecteurs » en histoire, anthropologie, philosophie, linguistique, traductologie ou mathématiques est assemblé, formé à un ensemble de logiciels de traitement de documents numériques et chargé de produire des rapports d’usage nécessaires à la rédaction d’un cahier des charges dans l’objectif d’un appel d’offres pour maquettes (BnF 1990).

      Deux projets de stations sont présélectionnés et déployés sur le site de l’EPBF, alors situé à Ivry, afin d’être plus largement testés, notamment par les laboratoires du CNRS (Richard 1993). À terme, sont alors prévus entre 250 et 300 postes informatiques dotés de scanners, d’imprimantes et d’OCR, mis à disposition dans les carrels individuels du futur site de Tolbiac. Les postes doivent être munis de logiciels du marché pour la structuration des textes, l’indexation et la visualisation du corpus, l’annotation, l’extraction, le rapprochement et la gestion de la base de textes. On envisage pour l’année 1995 un catalogue interne de 350 000 ouvrages littéraires, philosophiques, scientifiques, anthropologiques, auxquels les lecteur·ices pourraient ajouter leurs documents personnels avec la possibilité d’exporter leurs propres notes (Virbel, s. d.).

      Avec un coût estimé à 13 milliards de francs en 19922, cette première numérisation de la Bibliothèque de France, imaginée dès sa conception, est également exposée à l’exposition universelle de Séville la même année.

      « Façons de lire »

      Bernard Stiegler occupe un rôle important dans le développement du P.L.A.O. de la fin des années 1980 jusqu’au milieu des années 1990. Il est alors en poste à l’Université technologique de Compiègne et travaille notamment à sa thèse de doctorat en philosophie, dirigée par Jacques Derrida et soutenue à l’EHESS en 1993, qui deviendra le premier tome de Technique et temps. Il est donc particulièrement attentif aux dispositifs techniques envisagés comme prothèses de la pensée – à la technique comme « organe exosomatique » (Stiegler 1994). Stiegler est à la fois le président du groupe de travail sur le P.L.A.O. monté en septembre 1989 et l’un des neuf « grands lecteurs » du « banc d’essai » de 1990.

      C’est en tant que grand lecteur que Bernard Stiegler rédige un rapport d’usage en forme d’essai anthropologique sur l’activité de lecture dans toute son épaisseur matérielle (cf. illus. 1) :

      Il s’agit de comprendre comment les « supports de la pensée » sont l’effectivité et l’acte même de cette pensée – ou comment les caractéristiques matérielles de la mémorisation, de la temporalisation, de la lecture-écriture, ouvrent et ferment leurs possibilités (Stiegler 1990, 7, emphase originale)

      Ce qui l’intéresse au premier chef, c’est donc comment un outillage numérique, envisagé dans sa matérialité, pourrait équiper des pratiques existantes – les « systématiser » et les « optimiser » (Stiegler 1990, 7) – autant qu’en faire émerger de nouvelles. Il s’attelle donc, dans une veine paléoanthropologique à la Leroi-Gourhan, à décrire la « chaîne type d’opérations pour l’exploitation d’un texte » (Stiegler 1990, 12) selon un registre limité de six « classes d’opérations qui structurent a priori la plupart de [s]es lectures : l’annotation, le commentaire, l’extraction, la recherche, la corrélation, la documentation » (Stiegler 1990, 1).

      Première page du Complément au rapport de grand lecteur de Bernard Stiegler (BnF, 2006/079/235)

      Dans ce cadre conceptuel, pour Stiegler, l’activité de pensée inhérente à l’activité de lecture consiste à « lier entre eux divers textes » en faisant « apparaître des concepts génériques » (Stiegler 1990, 2). Lire et écrire sont deux opérations de pensée essentiellement liées – « Lire c’est faire monter la glose comme on fait lever une pâte, c’est faire disparaître, comme dans le chiasme d’un sablier, le texte commenté dans le palimpseste de son commentaire. » (Stiegler 1990, 4) – et l’activité de pensée consiste précisément en un cheminement dont la possibilité est ouverte par le lien créé durant l’opération de lecture-commentaire :

      Il y a, dans ce cas de la lecture assistée par ordinateur, une question de méthode au sens étymologique, c’est-à-dire de cheminement. Le savoir est cumulatif dans cette stricte mesure où il fraye les chemins sur lesquels il devra toujours repasser et réfléchir pour se poursuivre : il est méthodique en ce sens. [en note : De ce point de vue, toute philosophie, comme discours sur la nature du savoir, est une théorie de la lecture au sens de ce cheminement dans les textes accumulés qu’est la méthode (entendue ici en un sens bien différent de celui de Descartes – c’est la différence entre methodos aristotélicienne et methodus cartésienne).] (Stiegler 1990, 9, emphase originale)

      On retrouve cette perspective chez d’autres grands lecteurs, comme Christian Jacob, qui voyait dans le numérique l’ouverture de nouvelles possibilités : « un nouveau mode de visibilité du texte et en anticipant l’une des pratiques fondamentales du public des chercheurs, l’association aussi étroite que possible de la lecture et de l’écriture » (Jacob 1991). La numérisation de la bibliothèque est donc d’abord envisagée comme la numérisation, et l’outillage en conséquence, des pratiques de lecture et d’écriture des chercheur·euses.

      Une remédiation des pratiques savantes pour un nouvel ordre des savoirs ?

      Cette remédiation apparaît comme analyse au sens étymologique du terme, c’est-à-dire comme un découpage des pratiques de lecture et d’écriture savantes en séquences d’opérations matérielles simples (des chaînes opératoires) qui peuvent être outillées indépendamment et spécifiquement. Analogue à l’opération historique de « réduction en art », il s’agit d’une « mise en ordre méthodique » des pratiques savantes dans l’objectif de les équiper (Dubourg Glatigny et Vérin 2008). La bibliothèque numérique est donc d’abord envisagée dans sa dimension infrastructurelle et plus spécifiquement encore dans sa fonction de support à l’activité de lecture des chercheur·euses.

      Cette remédiation à caractère anthropologique peut apparaître aussi quelque peu téléologique, car orientée vers la concrétisation d’un dispositif logiciel modulaire. En effet, l’un des attendus de ce groupe de travail est de pouvoir nourrir les réflexions alors en cours à la BnF en vue de la rédaction d’un appel d’offres pour l’articulation d’un ensemble de logiciels de numérisation, océrisation, prise de note, traitement de texte.

      Ainsi, après les tests et rapports des grands lecteurs, il aura fallu traduire cette modélisation anthropologique dans un cahier des charges qui exprime les besoins qui doivent être satisfaits par les fonctions des futurs dispositifs. C’est donc une chaîne de remédiations qui se dessine depuis les formulations utopiques du projet de Très Grande Bibliothèque jusqu’aux maquettes et stations de test réalisées par des entreprises informatiques (BnF, 2006/079/160), en passant par les rapports des grands lecteurs et la rédaction d’un cahier des charges fonctionnel, reposant, comme en programmation, sur une « analyse orientée objet » (BnF, 2006/079/236/2).

      Si le P.L.A.O. ne prétend pas se substituer aux pratiques existantes, mais plutôt s’hybrider à elles, cette « bibliothèque virtuelle » (Maignien 1995) ne promet pas seulement un « nouveau mode de visibilité des textes », comme l’annonce Jacob (1991), ou de nouvelles formes de cheminement, comme chez Stiegler. Plus encore, il doit faire advenir un ordre des savoirs contemporain, abolissant la « visée classificatoire » des siècles précédents pour s’acheminer vers un « encyclopédisme relationnel-réticulé » :

      Ordonnateur, ordinateur de textes, l’informatique permet, autorise presque le démembrement des volumes, reliures, séries, collections, pour s’ouvrir, à partir de ces matériaux, sur une recomposition, de nouveaux liens, de nouvelles circulations hypertextuelles, créant ainsi des éditions ou des bibliothèques virtuelles, faisant apparaître des généalogies, des archéologies, des volontés de savoir non directement explicites, libres des organisations de savoir qui furent les leurs. (Maignien 1995, je souligne)

      Cette logique de « démembrement » évoluera au cours de l’histoire de la BnF ; nous la retrouverons dans la suite de cet article avec la « délinéarisation » promise par la structure hypertextuelle (Bermes 2020) (cf. section 2) et les ambitions de « désilotage » des collections à l’heure des données (Bermès et Leclaire 2022) (cf. section 3). Escamotant ainsi les ordres du savoir passés, les logiques patrimoniales et les pratiques non académiques, le projet de P.L.A.O. oriente également des politiques de numérisation qui ne sont pas des politiques de patrimonialisation et se concentrent sur des textes canoniques pour des érudits professionnels des SHS – parfois qualifiée de « bibliothèque de l’honnête homme » (Bertrand et Girard 2016; Bermès 2023).

      En effet, la remédiation numérique envisagée dans un premier temps à la Bibliothèque de France naissante est donc double : numérisation des pratiques par la conception d’outils nouveaux à destination des chercheur·euses et numérisation de corpus de documents circonscrits par celleux-ci. Dès 1992, une mission de la numérisation est créée (BnF, 2020/003/006 et 2020/003/007). Composée principalement d’ingénieurs informaticiens, elle s’attelle à la conversion numérique de documents et de microfiches, au déploiement d’outils d’océrisation, au stockage de masse, etc. À nouveau, l’opération de numérisation s’inscrit donc dans une chaîne de remédiations successives : ce ne sont pas directement les collections de la BnF qui sont alors numérisées, notamment car elles sont trop fragiles (Bermès 2023), mais plutôt des supports déjà remédiés, tels que des microfiches, qui ont aussi leur effet matériel sur le patrimoine et ses pratiques3.

      Selon les travaux de Gaëlle Béquet, cette première étape de numérisation de la bibliothèque qui fait la part belle au « modèle de la lecture savante » se fait en opposition à « la démocratisation de l’accès au savoir et l’accueil de nouveaux lecteurs dans les salles de lecture » (Béquet 2014, 63). Pour Alain Giffard, alors directeur de l’informatique et des nouvelles technologies de l’EPBF, cela conduit à des frictions entre les « prérogatives patrimoniales » de l’historique Bibliothèque nationale et « l’effort technologique » de la nouvelle Bibliothèque de France (Giffard interrogé par Béquet (2014), 66-67). Et Gaëlle Béquet de noter les « groupes marginaux » de cette bibliothèque numérique projetée que fut le P.L.A.O. : outre les usager·es non académiques, elle visait « les bibliothécaires, et particulièrement ceux de la Bibliothèque nationale (BN), les éditeurs et les auteurs » (Béquet 2014, 63 sq).

      La bibliothèque numérique comme plateforme

      Du P.L.A.O. à Gallica

      En 1994, la fusion est opérée entre l’EPBF et la BN sous le nom de Bibliothèque nationale de France (BnF), dont le décret de création met au premier plan les missions patrimoniale et d’accès aux collections. Si la modernisation est toujours au cœur de la BnF, la technique se voit subordonnée à l’accès, et l’accès à distance en particulier, autour de dispositifs de communication plutôt que de lecture-écriture. L’arrivée d’Internet met fin à l’idée d’une consultation exclusivement intra-muros tandis que des économies budgétaires mettent la numérisation au second plan. La composante dédiée aux outils et aux dispositifs de soutien dans le cadre du projet P.L.A.O. est donc progressivement abandonnée entre 1994 et 1995. Il s’agit également d’une décision d’orientation stratégique à la suite du remplacement d’Alain Giffard par l’historien André Zysberg qui déclare publiquement que « la BNF n’est pas un laboratoire de recherche mais une bibliothèque » (Perriault (1995), citée par Béquet (2014), p. 113). Cette déclaration atteste de l’ampleur des bouleversements occasionnés par l’irruption du numérique dans une institution comme celle-ci : il affecte jusqu’aux mandats, voire l’identité, de la bibliothèque inscrite dans un réseau d’autres organisations patrimoniales et de recherche4. Il s’agit pour lors de revenir sur les missions patrimoniales et les métiers de la BnF : la numérisation pour la conservation et la diffusion au plus grand nombre, ainsi que la consultation et la valorisation publiques plutôt que la seule lecture savante.

      Entamée dès 1992, c’est donc à des fins patrimoniales et scientifiques que la numérisation se poursuit. Les bibliothécaires ne sont plus marginalisé·es, non sans heurts :

      Des difficultés surgissent quand deux cadres d’usage s’affrontent : celui de la mission scientifique qui cherche à poursuivre sa politique documentaire encyclopédique des imprimés numérisés, et celui des bibliothécaires de la direction des services de la conservation, qui obéissent à des impératifs de sauvegarde des documents, notamment pour ceux fréquemment communiqués aux lecteurs. (Béquet 2014, 117)

      La confrontation entre ces deux cadres d’usage aboutit à une voie moyenne qui permet à la BnF de donner accès, à un plus large public que précédemment, à des ensembles de documents structurés en corpus, mais ne relevant pas nécessairement des collections de la bibliothèque. La très grande majorité de ces documents sont accessibles en « mode image » – i.e. ne sont pas océrisés – ce qui pose par ailleurs certains problèmes d’accessibilité (Wagneur 2002).

      En 1997, Gallica est mise en ligne grâce notamment au travail d’un informaticien qui « n’a pas eu connaissance des travaux menés sur le PLAO par l’EPBF et n’a pas lu le rapport des grands lecteurs » (Béquet 2014, 133). C’est une première étape dans l’irruption d’Internet au sein de la bibliothèque, qui permet à l’institution de « s’approprier les codes du web » (Bermes 2020, 13 sq) notamment du point de vue de la nature et des pratiques des publics, ainsi que le rôle présumé de l’hypertexte dans la dé- et restructuration des documents numériques.

      Un « département de la bibliothèque numérique », distinct du service informatique, est créé en 1999 (Bermes 2020, 13) afin de « maîtriser la zone d’incertitude technologique que représentait le numérique et de lancer le processus d’innovation » (Béquet 2014, 27). Ce département dédié entérine la séparation entre la conception de l’outil et la numérisation de la collection – il sera supprimé en 2008 lorsqu’on considérera que « toute la bibliothèque était devenue numérique » (Bermes 2020, 33). Nous verrons plus tard comment l’irruption des données dans « toute la bibliothèque » amènera à nouveau une remédiation de celle-ci.

      En 2004, sous la présidence de Jean-Noël Jeanneney qui présente Google Books comme un péril civilisationnel (Jeanneney 2005), la BnF s’engage dans une étape d’« industrialisation » de la numérisation (Bermes 2020, 29 sq), qui se fait alors en masse, doublée d’une océrisation systématique, d’indexation plein texte et d’un moteur de recherche central. Enfin, en 2011, au moment où le Centre Pompidou structure ses données en une base novatrice pour favoriser la navigation et produire des « parcours de sens » (Bermès 2013), la BnF décide de centraliser ses données sur la plateforme data.bnf.fr entendue comme « pivot documentaire » – c’est-à-dire comme outil pour centraliser, aligner et lier les métadonnées de systèmes d’information internes et externes à la BnF (Duhamel 2014) –, présenté comme une volonté d’améliorer la découvrabilité des contenus culturels sur le web (Levoin 2021) autant qu’une « opportunité de passer outre la diversité des formats et des outils » pour se placer « au-delà des silos » (Dalbin et al. 2011).

      La plateformisation comme remédiation

      Résultant donc de choix politiques et culturels, d’un contexte sociotechnique et d’une dynamique administrative, Gallica est aujourd’hui une plateforme en ligne qui rassemble plus de dix millions de documents numérisés dans le domaine public – imprimés, presse, manuscrits, cartes, estampes, photographies… – couvrant une période allant du Xe au XXe siècle et de nombreuses langues. Tous les documents sont librement consultables en ligne sur une liseuse dédiée ainsi que téléchargeables. Un moteur de recherche permet de naviguer dans ce corpus foisonnant qui fait aussi l’objet d’éditorialisation ponctuelle par parcours thématiques, dans des billets de blog et sur les réseaux sociaux (Bertrand et Degrange 2021). Avec près de 20 millions de visites par an, la fréquentation de Gallica est largement plus importante que celle des sites physiques de la BnF (Bastard et Laborderie 2023). Les publics sont plus divers qu’à la bibliothèque, moins captifs et surtout dans un rapport d’emblée moins étroit avec l’institution : ils peuvent n’être que de bref passage, voire ignorer être sur un site de la BnF. Si beaucoup de ces visites sont très courtes, il existe également une communauté d’usager·es fréquent·es, qui passent du temps sur Gallica et participent à la circulation de ses contenus sur le Web grâce aux réseaux sociaux, blogs et Wikis : les gallicanautes (Pardé et Bastard 2020).

      La plateforme Gallica est donc une remédiation de la bibliothèque comme, d’une part, numérisation de reproductions (microfiches), de doublons, ou de collections d’institutions partenaires5 et, d’autre part, numérisation de leur accès comme service. Il s’agirait donc non seulement d’une bibliothèque numérique, mais plus encore d’une bibliothèque numérique en réseau (i.e. sur Internet). L’on voit d’emblée que seules certaines dimensions de la bibliothèque ont été « amplifiées » par le numérique, d’autres minimisées : la crise sanitaire en 2020 a par exemple vu surgir des espaces de travail spontanés sur Zoom comme remédiation « d’urgence » pour assurer une certaine « continuité des bibliothèques » (accès aux documents, pratiques de travail) (Bert-Erboul, Fayet, et Wiart 2022), tandis que la remédiation des espaces d’exposition relève encore de l’expérimentation (Zaslavsky et Bastard 2024).

      Dans cette deuxième étape de la remédiation de la BnF, la bibliothèque numérique se situe donc à l’intersection d’une collection numérisée et d’une plateforme de consultation – appuyée sur l’infrastructure tout à la fois documentaire, logicielle et matérielle qui est celle de la bibliothèque. Si les plateformes commerciales sont souvent évoquées, ainsi que leurs logiques de captation des usager·es et de monétisation de leurs données, l’on compte aussi au nombre de celles-ci, agissant selon des modalités différentes, les bibliothèques numériques, les entrepôts de données, les espaces de partage de méthodes ou les logiciels de prise de notes ou de constitution de bibliographies munis de fonctionnalités de collaboration. Il n’est pas acquis cependant qu’une plateforme de consultation de contenus soit par défaut une bibliothèque numérique. Notamment, OpenEdition qui héberge et diffuse des revues, collections de livres, blogs et évènements scientifiques sans logique institutionnelle de collection ne peut être considérée au sens propre comme une bibliothèque numérique, ni arXiv qui est un dépôt de pre-prints.

      Pour cette raison, donnons-nous une définition – de prime abord seulement (ex. Silva Neto et Chiarini (2023)) – plus technique que politique ou économique d’une « plateforme » comme un dispositif sociotechnique qui, via une ou plusieurs interfaces, produit un ou des environnements structurés organisant la mise en relation entre i) des usager·es et des contenus/données/services hiérarchisés, et ii) les usager·es entre eux selon des modalités contraintes, et iii) qui produisent des traces de l’activité en leur sein. C’est bien le cas de Gallica, dont la fonction primaire est de donner accès, à un public le plus large, à une collection de documents numérisés par le biais d’un dispositif logiciel, un medium qui hiérarchise les documents et les rend manipulables tout en contraignant les modalités pratiques de leur consultation.

      Appuyée sur l’infrastructure documentaire (bases de données, formats, standards), logicielle (application, interopérabilité, APIs) et matérielle (serveurs, disques, câbles) de la BnF comme bibliothèque institutionnelle, la plateforme Gallica et ses collections numérisées insèrent la bibliothèque dans un plus large espace public numérique que ne le pouvait le P.L.A.O. Avec l’ouverture vers les réseaux sociaux, le « pivot documentaire » qu’est data.bnf.fr, et surtout avec les missions de médiation numérique de la plateforme grâce à des parcours thématiques ou l’éditorialisation de contenus, notamment sur le blog associé, la plateformisation comme remédiation est donc bien à comprendre dans son articulation avec la bibliothèque comme institution d’une part et les publics d’autre part. Adossée à l’institution, Gallica ouvre ainsi un espace d’appropriation de ses contenus par ses usager·es. Où l’on voit déjà que les effets de la numérisation vont bien au-delà de la remédiation comme simple traduction d’un medium à un autre, nous y reviendrons.

      Une remédiation des collections par-delà les logiques documentaires ?

      Si les pratiques ne sont pas le cœur de la remédiation par Gallica, comme c’était le cas avec le P.L.A.O., la plateformisation a néanmoins une influence sur elles. De manière générale, l’insertion dans l’espace du web naissant joue sur la conception même de l’information. La structure hypertextuelle d’Internet permet en droit la « délinéarisation » des objets-documents qu’elle recèle (Bermes 2020, 20), c’est-à-dire qu’elle ouvrirait la possibilité de pouvoir consulter un document de manière plus fragmentaire qu’à la bibliothèque en ne s’intéressant qu’à ses plus petites parties – un phénomène renforcé par les moteurs de recherche permettant d’y entrer à l’échelle du mot, voire du caractère. Plus encore, les documents (de quelque nature que ce soit) s’y trouveraient réduits à des 1 et des 0, encodés dans le même format, et intégrés à un même moteur d’indexation, si bien qu’un robot indexateur ne serait pas concerné par leur nature (qui n’est qu’une métadonnée), ou qu’un algorithme d’humanités numériques pourrait être, dit-on, « agnostique » – c’est-à-dire qu’il traite les données indépendamment de leur contenu, de leur format, de leur matérialité antérieure.

      La structure logique des documents serait-elle ainsi dissociée de leur structure matérielle ? Pas complètement, cela dépend des pratiques des usager·es. En effet, si l’on reprend la définition de la médiation comme inscription d’une chose informe dans un régime signifiant (cf. Introduction du dossier), l’émergence du sens a lieu ici dans la pratique documentaire, c’est-à-dire dans la saisie par un·e lecteur·ice d’une unité documentaire à travers des media particuliers. Cette saisie, dans toute son épaisseur pratique, permet d’envisager un même document comme œuvre (lecture cursive), métadonnées (travail bibliographique), information (accès fragmenté) ou données (analyse quantitative).

      Du point de vue des pratiques savantes en particulier, le « démembrement » possible des unités documentaires au sein d’un tel îlot de cohérence annonçait également le décloisonnement des perspectives et des logiques thématiques (incarnées notamment par un descripteur comme la classe Dewey) et favorisait, a priori, une plus grande interdisciplinarité. Le P.L.A.O. avait d’ailleurs été initialement pensé dans ce même horizon :

      Dans le projet initial, point de catalogue bibliographique, « de visées d’organisation arborescente, hiérarchisée, systémique du savoir » mais une indexation qui fait la part belle à l’interdisciplinarité. Pour la mission scientifique de numérisation, la collection doit être un assemblage de rhizomes, c’est-à-dire un réseau non hiérarchique entre les connaissances. (Béquet 2014, 73)

      Cependant, l’étude des pratiques de navigation des usager·es de Gallica montre que celleux-ci ont généralement tendance à parcourir les collections « en silo » correspondant aux classes Dewey – alors même qu’en entretien celles-ci sont quasi systématiquement écartées, voire dénigrées (Dumas Primbault 2023). C’est plutôt la masse de documents qui permet aux usager·es de naviguer contextuellement dans des champs étrangers, vers des ressources nouvelles. Lorsqu’ils font usage du moteur de recherche – réputé dysfonctionnel – de la plateforme, les usager·es ne visent pas la restitution exhaustive des documents pertinents à une requête parfaitement formulée, mais déploient plutôt des stratégies individuelles de gestion du niveau de « bruit » nécessaire à s’aventurer dans le corpus foisonnant de Gallica (Dumas Primbault, s. d.b).

      À noter que, dans la continuité des problématiques liées au P.L.A.O. et parallèlement aux pratiques de navigation sur Gallica, il convient dans ce contexte d’interroger également les transformations des pratiques de lecture. La « lecture distante [distant reading] » (Moretti 2013), notamment, s’est rapidement proposée comme moyen de manipuler de très grandes quantités de documents textuels par leur réduction à des unités minimales (tokens). Ainsi remédié en données, ou datafié, le texte qui n’en est plus un (Gavin 2020) peut être analysé grâce à des opérations de calcul menées sur les tokens (fréquence, cooccurrence, proximité sémantique) et la génération de formes visuelles (matrices, graphes, clusters) à interpréter.

      Cette chaîne opératoire computationnelle complexe soulève une question centrale aux humanités numériques, celle de l’herméneutique : la lecture distante est-elle véritablement une pratique de lecture ou bien l’opération herméneutique s’est-elle déplacée dans l’interprétation des produits du calcul (Drucker 2017; Da 2019) ? Quoi qu’il en soit, après la dissolution ou délinéarisation du corpus, la production de sens ne peut se faire que par retextualisation, ou en recouvrant une unité documentaire (Bachimont 2025).

      En deçà de ces controverses, ce qu’illustre la lecture distante pour notre propos c’est que « la donnée », plutôt que comme format ou matériau, peut-être envisagée comme une modalité de saisie des documents par des usager·es humain·es et non humain·es. En effet, un même document présent sur Gallica pourra être saisi tour à tour comme une œuvre par qui voudra en faire la lecture cursive, comme une référence par qui construit une bibliographie ou comme une donnée par un robot qui moissonne la bibliothèque en vue de pratiquer la lecture distante.

      Plutôt qu’une « délinéarisation » indiscriminée, une des conséquences de la numérisation des collections et leur plateformisation est la pluralisation des modalités d’accès au contenu en fonction de l’unité documentaire pertinente pour l’usage, ce qui se traduit par des régimes de navigation ou de consultation pluriels et une conséquente relinéarisation dans la production de sens par cheminement (Dumas Primbault 2023). Ainsi, si le web peut sous certains aspects être envisagé comme un espace documentaire au sein duquel le document est « démembré », Gallica apparaît, en tant que bibliothèque numérique d’une institution patrimoniale, comme un « îlot de cohérence » (Boullier et Ghitalla 2004, 174) grâce à ses logiques de sélection, de consultation et l’architecture informationnelle qui la sous-tend.

      La bibliothèque numérique comme écosystème

      Le schéma numérique 2020 de la BnF

      Après le numérique, puis Internet, c’est l’irruption des données – ou plutôt la « revanche des données » (Illien 2016) – qui inaugure une troisième étape dans la remédiation numérique de la BnF. Une « revanche » en effet, car, comme le souligne Emmanuelle Bermès en préface de l’ouvrage de Véronique Mesguich Les bibliothèques face au monde des données :

      les données font partie de l’identité des bibliothèques, de leur cœur de métier, depuis des décennies, voire des siècles. […] Auparavant, le monde des données, même si on ne l’appelait pas de cette façon, était leur monde : élaborer un catalogue ou un inventaire suivant des règles précises, s’assurer qu’une information reste accessible au sein d’une masse de milliers d’objets, analyser la nature, la forme et le contenu d’un document ou encore mettre en œuvre les moyens de sa conservation sur le long terme sont autant de savoir-faire qui font partie depuis toujours des pratiques des professionnels de l’information. (Bermès in Mesguich (2023), 7-8)

      L’avènement du numérique et du web avait vu le déplacement de ces compétences et expertises vers de nouveaux acteurs commerciaux et de nouveaux corps de métiers – et ce, jusqu’au sein même des départements de la BnF, comme c’était le cas, par exemple, avec la marginalisation des bibliothécaires au temps du P.L.A.O. Plus récemment donc, la réappropriation de ces terrains par les bibliothèques, au prisme des « anciennes traditions documentaires » (Bermès in Mesguich (2023), 9), amorce une nouvelle étape de la numérisation de celles-ci.

      De manière évidente l’histoire du numérique à la BnF est celle d’une emprise grandissante sur la bibliothèque – « tous les services et les départements de la BnF sont devenus “numériques” » (Leclaire 2021, para. 8) – et c’est pour répondre à cette ubiquité que la BnF a souhaité renouveler son « schéma numérique » en 2020 – puis se doter, en 2022, d’une feuille de route pour l’intelligence artificielle afin de « faire de l’IA une dynamique transverse du nouveau contrat, susceptible d’apporter des pistes d’innovation dans tous les domaines métier de la bibliothèque » (Bermès et Leclaire 2022, para. 5).

      « Cartographie métaphorique » du Schéma numérique 2020 de la BnF

      Le schéma numérique de 2020 est une pièce importante pour comprendre la remédiation de la BnF car il prend la forme d’une « cartographie métaphorique » (Leclaire 2021) (cf. fig. 2) – résultant elle-même d’une (courte) histoire de remédiation dudit schéma qui, entre 2008 et 2016, oscillait entre des formes textuelles et graphiques. Réalisée grâce au concours de 150 collaborateur·ices de la BnF et d’autres institutions, cette cartographie est accompagnée d’un ensemble de 40 cartes de jeu visant à documenter plus en détail certains éléments (outils, visions, stratégies…) présents sur les tuiles du schéma. Ensemble, cartographie métaphorique et jeu de cartes doivent offrir « une vision panoramique et complète de la vie numérique de la BnF » (Leclaire 2021, 1). Se refusant néanmoins à une vision figée et exhaustive d’un phénomène en constante évolution, cette vision panoramique doit faire place aux expérimentations, balbutiements et angles morts de façon à pouvoir également « déranger le numérique pour mieux faire surgir les transversalités et ouvrir des perspectives » (Leclaire 2021, 2).

      Les données liquides

      Les discours d’escorte de cette cartographie ne manquent pas d’éléments rhétoriques situant le schéma numérique 2020 de la BnF dans une rupture radicale avec le passé. Comparé notamment à la fondation de Rome par le truchement d’une citation à un ouvrage intitulé Contre les barbares6, le schéma numérique de 2020 s’ancre également dans la notion d’homo connectens, après l’homo applicans de 2008 et l’homo agens de 2016, métaphore de l’espèce humaine prise dans une longue histoire paléoanthropologique qui inclurait désormais le numérique (Leclaire 2021).

      Dans cette même veine, l’entreprise cartographique relève d’ailleurs d’une volonté assumée de recourir à une sémiotique qui produise de l’« évidence »7, c’est-à-dire de représenter comme carte « ce qui n’est pas a priori spatial » et, ce faisant, bénéficier de prises spatialement évidentes (« propriétés iconiques », « outil de repérage », « dimension topologique ») pour saisir un objet qui, sans cela, aurait nécessité une sémiotique plus hermétique (Leclaire 2021, 11‑12). Une métaphore particulièrement intéressante à cet égard est celle de la matérialité liquide des données. En effet, un « lac des données », topographiquement en amont de toutes les autres tuiles, irrigue le reste de la carte grâce à de nombreux « fleuves des données ». Seule une « source de l’intelligence artificielle », à la lisière d’une terre inconnue, semble précéder ce lac dans l’ordre écologique.

      Initialement née en 2010 dans le domaine technique pour désigner un système de stockage spécifique de données hétérogènes massives et non structurées, la métaphore du lac des données s’est rapidement émancipée de son substrat technique pour rejoindre le champ sémantique hydraulique du « Big Data » (Bernardot 2018) – en particulier à la suite du « déluge de données » qui, d’après Chris Anderson (2008), annoncerait l’avènement d’une nouvelle révolution scientifique. Prolongeant le « démembrement » de l’époque du P.L.A.O. et la « délinéarisation » de l’étape hypertextuelle, la « liquidité » des données serait garante, au même titre que celle d’un marché financier, de la circulation sans contraintes et sans friction de flux d’une information désormais affranchie des « carcans de la pensée documentaire » (Poupeau 2024, para. 3). Ainsi, dans le cadre de la feuille de route pour l’IA à la BnF, le « silotage des collections » est vu comme un obstacle à « la gestion des données et leur qualité » (Bermès et Leclaire 2022, para. 8).

      En ce sens, cette étape de « datafication » ne peut pas exactement être envisagée comme une remédiation au sens propre du terme. De prime abord, la mise en données peut bien être comprise comme opération de remédiation visant à traduire un objet documentaire en un ensemble d’unités manipulables qui n’ont aucun sens pour le calcul computationnel mais qui permettent la construction de sens par leur accumulation, combinaison, comparaison (Bachimont 2020, 2022). Cependant, précisément parce que ces unités manipulables n’ont pas de sens et parce que le calcul agit sur elles de manière « agnostique », la mise en données de toutes choses permettrait de s’affranchir du medium même afin de mettre en relation les objets les plus hétérogènes, par-delà leur format (texte, audio, vidéo), leur langue, leur discipline, leur période historique – donc de « désiloter », de fluidifier, d’ouvrir un espace de circulation liquide.

      La notion d’« investissement de forme » empruntée par Alain Desrosières à la sociologie pragmatique de Laurent Thévenot pour comprendre la quantification du monde social à travers l’histoire de la statistique est ici opérante (Desrosières 2010). En effet, la mise en données, entendue comme mise en forme, représente bien un investissement au sens où certaines propriétés des objets transformés, comme leur matérialité, leur contexte, jusqu’à leur sens même, sont troquées au profit de nouvelles propriétés que sont la manipulabilité, le calcul ou encore la liquidité. Il s’agit donc bien d’une remédiation mais d’un type singulier, inaugurant un espace qui escamote toute médialité pour permettre la mise en équivalence des objets les plus hétérogènes. « La donnée » y opère alors comme une monnaie ou une valeur dans un espace de circulation liquide. La datafication serait donc à envisager plutôt comme la construction d’un tiers espace d’équivalence générale et d’échange entre des unités minimales de construction de sens, circulables et manipulables en deçà ou au-delà de tout cloisonnement historiquement hérité grâce à leur liquidité. Il s’agirait en quelque sorte de la médiation des médiations.

      La naturalité liquide des données n’a pourtant rien d’une évidence. Elle est une construction technique, rhétorique, infrastructurelle et logicielle qui mérite que l’on se penche sur ses mécanismes (Dumas Primbault et Guhennec, s. d.). Le discours d’escorte du schéma numérique 2020 évoque en passant le hors-champ de la carte. Cependant, si l’on ouvrait cette dernière à la troisième dimension, nous y verrions peut-être des mines de métaux lourds et des fermes de travailleur·euses du clic. Les vertus de la représentation cartographique se doublent donc de contraintes sémiotiques, notamment dans l’agencement en deux dimensions contiguës, telles qu’un impératif de cohérence peut émerger du medium lui-même et non de son objet. Ici, ces contraintes escamotent par exemple les pratiques extractivistes nécessaires à la fabrique de la liquidité des données : notamment les chaînes de production et de traitement des données, le travail amont sur celles-ci, l’infrastructure matérielle, énergivore et polluante, mais également la disparition de tout ce qui ne se transforme pas en numérique, qui ne se datafie pas.

      Une remédiation de toute l’infrastructure pour l’avènement d’un écosystème ?

      Un autre champ sémantique émergeant du medium cartographique et qu’il convient d’interroger est celui du vivant, et plus spécifiquement de l’écologie. Car, faisant du numérique un écoumène métaphorique – composé de « l’océan (de la connaissance), la plage (de la médiation), la forêt (des collections numériques), la grande plaine (de la recherche et du monde universitaire), les chapelets d’îles (des bibliothèques numériques, des différents accès spécifiques) » (BnF 2020) – cette « carte appelle à être habitée [collectivement] » (Leclaire 2021, 12). Présenté comme un « écosystème libre et ouvert », le territoire décrit par cette cartographie doit également être compris comme prolongé par « l’étendue sans bornes de l’écosystème dans lequel s’inscrit la Bibliothèque » (BnF 2020).

      Souvent mobilisé, rarement défini, le terme d’« écosystème » apparaît nettement à partir des années 2010 dans les documents de politique – notamment rapports institutionnels et recommandations – et dans la littérature scientifique portant sur les infrastructures numériques de la connaissance (Dumas Primbault, s. d.a). Il s’inscrit également, depuis la fin du XXe siècle, dans une généalogie plus longue qui s’enracine dans l’écologie elle-même, dans la littérature de business management et dans la sociologie interactionniste (Mounier et Dumas Primbault 2023). Parfois utilisé pour naturaliser les dynamiques sociales du monde professionnel en une lutte pour la survie dans un environnement doté de ressources limitées ; parfois mobilisé comme synonyme plus clinquant pour désigner des structures, systèmes ou réseaux qui n’ont en rien changé, le terme d’« écosystème » agit la plupart du temps, en contexte d’usage, comme un « objet-frontière » (Star 2010) – c’est-à-dire comme un syntagme suffisamment plastique pour permettre la coordination de l’action d’acteur·ices hétérogènes autour d’un objet commun, sans que celleux-ci aient besoin de se mettre d’accord sur une définition commune et un horizon de valeurs partagé.

      Par ailleurs, pour beaucoup d’acteur·ices des infrastructures numériques de la connaissance, le terme d’« écosystème » permet aussi de désigner une réalité et une dynamique autres que celles des structures, des réseaux ou des systèmes (Dumas Primbault 2025). En effet, la prise de conscience de la grande fragilité et de l’évolution rapide du milieu sociotechnique dans lequel agissent ces professionnel·les marque le passage d’un régime infrastructurel de la connaissance – résultant de l’articulation mécanique entre des « boîtes noires » intégrées verticalement et fonctionnellement identifiées (institutions, maisons d’édition, bibliothèques, laboratoires) – à un régime écosystémique – résultant d’interdépendances organiques entre des entités mouvantes au sein desquelles ont été redistribuées les expertises et compétences à la faveur notamment de l’irruption du numérique (plateformes, réseaux sociaux, acteurs économiques comme des sociétés de conseil ou des startups du numérique, groupes de travail ou task forces).

      Présumé plus horizontal, plus dynamique, plus ouvert, ce régime écosystémique – qui répond aux mêmes logiques de décloisonnement que le démembrement ou le désilotage, mais aux plans technique, humain et organisationnel – peut être perçu par ses « habitants » comme un flou dont la saisie appelle des outils sémiotiques dédiés : un syntagme spécifique, une cartographie, des cartes de jeu – voire « l’idéal […] d’une représentation en temps réel de son activité » (Leclaire 2021, 6). Selon cette perspective, l’entreprise cartographique apparaît alors comme une remédiation (sémiotique) de la remédiation (numérique) de toute la BnF, c’est-à-dire comme un moyen de redonner sens et prise au décloisonnement maintes fois souhaité – via le numérique, puis le web, puis les données – de structures dites « traditionnelles ».

      Ainsi, à la faveur de la progression du numérique dans la BnF, la trop étroite définition de « bibliothèque numérique » – dont nous avions pu mesurer l’insuffisance en introduction – s’étoffe, s’enrichit et se complexifie. Avec Gallica, à l’infrastructure de la bibliothèque s’était ajoutée la plateforme. Ensemble, elles s’inscrivent désormais à plus grande échelle dans un large écosystème numérique. La numérisation comme remédiation générale de la bibliothèque – c’est-à-dire non seulement de collections mais encore de ses services, ses espaces de travail, ses sociabilités, ses lieux d’exposition, ses pratiques – ne peut donc être entendue seulement comme la traduction d’un medium à un autre. Nous l’avons vu avec la nécessité de penser la datafication comme ouverture d’un espace de mise en équivalente, le numérique – par son aspect ubiquitaire qui en fait un milieu (Bachimont 2017) – porte la remédiation sur les plans symbolique, organisationnel, institutionnel8. Il invite ainsi à repenser même la notion de remédiation au-delà des media pour questionner plus largement la médiation comme inscription d’une chose informe dans un régime signifiant (cf. Introduction du dossier), comme opération de mise en relation contrainte d’altérités à des échelles variées – par exemple infrastructure-plateforme-écosystème. Suivant Galloway, Thacker, et Wark (2022) pour qui il n’y a pas de media, seulement de la médiation, c’est ce que proposent Larrue et Vitali-Rosati (2019) avec la notion de « conjoncture médiatrice » :

      It is [a] desire to move away from mediation as an objectifiable and singular process that leads us to resist the idea of ’medium’ that refers to prefabricated mediation forms that are already structured and identifiable. In the instant of the action, if we observe the interplay of these elements, we can identify particular conjunctures. These conjunctures are moving combinations that form the elements in play at the time of the action. This is what we call ’mediating conjunctures’. (Larrue et Vitali-Rosati 2019, 52)

      Cela leur permet d’éviter d’essentialiser les media comme dispositifs sociotechniques figés et de suivre plutôt la dynamique de la médiation comme théâtre et condition de possibilité de l’action.

      Conclusion : un (dés)ordre du savoir numérique ?

      Entamée sous l’angle des pratiques savantes grâce à l’outillage promis par le P.L.A.O., continuée par la création de Gallica comme plateforme de consultation de documents numérisés, prolongée par la « revanche des données » annoncée par le schéma numérique de 2020, la remédiation numérique de la Bibliothèque nationale de France se poursuit aujourd’hui à l’aune de l’intelligence artificielle qui a fait l’objet d’une feuille de route spécifique (BnF 2021). La « bibliothèque numérique », d’abord envisagée dans sa dimension infrastructurelle, puis dans sa dimension patrimoniale, s’étoffe à chaque étape de dimensions nouvelles.

      Des projets en cours de fouille d’images dans Gallica, de reconnaissance d’écriture manuscrite ou de recommandation personnalisée remettent au goût du jour l’outillage des pratiques, pour un plus large public. Les « chantiers catalogue » visent à tirer parti de l’architecture informationnelle héritée de la longue histoire de la bibliothèque à l’aide de méthodes nouvelles. Les applications permises par les grands modèles de langage (LLM) articulés à des agents conversationnels (chatbots) promettent la remédiation de certaines fonctions informationnelles et de sociabilité. Tandis que des prospectives d’« application de l’IA dans le domaine RH » ou d’« assistance aux prises de décisions quotidiennes » annoncent la numérisation de la bibliothèque comme organisation socioprofessionnelle.

      Dans l’histoire de la remédiation numérique de la BnF, l’irruption du numérique promettait avec le projet P.L.A.O. le « démembrement » des volumes et des reliures, l’émergence du web annonçait avec Gallica la « délinéarisation » des documents, la « revanche » des données nécessitait le « désilotage » des collections. Cette rhétorique toujours reconduite de décloisonnement et d’abolition des structures matérielles et informationnelles du passé n’est de manière évidente pas seulement une problématique relative à la nature de l’information – il en va également de l’ordre du savoir : bien que les études de pratiques montrent qu’il faut relativiser ces prophéties, les catégories des siècles précédents sont présumées dépassées, il faudrait les abolir pour accueillir l’avènement d’un ordre « relationnel-réticulé », d’un « rhizome », d’un « lac »… Nous avons vu également que cette rhétorique du décloisonnement s’accompagnait d’une fragmentation et redistribution des infrastructures en un écosystème en perpétuelle évolution. L’histoire récente des humanités numériques invite cependant à ne pas tomber dans l’écueil de la table rase (Mounier 2018) tandis que des appels à resémantiser – donc restructurer – une IA présumée liquide se font entendre (Boullier 2025). Quel ordre du savoir souhaitons-nous construire à l’horizon de ces remédiations tout à la fois informationnelles, infrastructurelles et politiques ? Quelles conjonctures médiatrices pour le théâtre du savoir à l’ère du numérique ubiquitaire ?

      Bibliographie

      Anderson, Chris. 2008. « The End of Theory: The Data Deluge Makes the Scientific Method Obsolete ». Wired. https://www.wired.com/2008/06/pb-theory/.
      Bachimont, Bruno. 2017. « Le numérique comme milieu : enjeux épistémologiques et phénoménologiques. : Principes pour une science des données ». Interfaces numériques 4 (3):385‑402. https://doi.org/10.25965/interfaces-numeriques.386.
      Bachimont, Bruno. 2020. « Manifeste pour l’intelligibilité du numérique ». Intelligibilité du numérique. https://doi.org/10.34745/numerev_1922.
      Bachimont, Bruno. 2022. « La complexité herméneutique à l’épreuve du calcul ». Interfaces numériques 10 (3). https://doi.org/10.25965/interfaces-numeriques.4686.
      Bachimont, Bruno. 2025. « Ce que fait la donnée au contenu : entre dissolution dans le lac (web des données) ou réinvention factice (IA) ». Conférence. MSH Sud. https://doi.org/10.60527/3q4h-w393.
      Bastard, Irène, et Arnaud Laborderie. 2023. « La découvrabilité des collections numériques patrimoniales sous l’angle des usages de Gallica ». Bulletin des bibliothèques de France. https://bbf.enssib.fr/matieres-a-penser/la-decouvrabilite-des-collections-numeriques-patrimoniales-sous-l-angle-des-usages-de-gallica_71295.
      Béquet, Gaëlle. 2014. Trois bibliothèques européennes face à Google : Aux origines de la bibliothèque numérique (1990-2010). Mémoires et documents de l’École des chartes. Paris: Publications de l’École nationale des chartes. https://books.openedition.org/enc/14063.
      Bermes, Emmanuelle. 2020. « Le numérique en bibliothèque : naissance d’un patrimoine : l’exemple de la Bibliothèque nationale de France (1997-2019) ». Thèse de doctorat, Ecole nationale des chartes. https://theses.hal.science/tel-02475991.
      Bermès, Emmanuelle. 2013. « Des parcours de sens dans le Centre Pompidou virtuel ». Bulletin des bibliothèques de France, nᵒ 5:52‑57. https://bbf.enssib.fr/consulter/bbf-2013-05-0052-013.
      Bermès, Emmanuelle. 2023. « Trente ans de numérique à la BnF ». Balisages. La revue de recherche de l’Enssib, nᵒ 6. https://doi.org/10.35562/balisages.1099.
      Bermès, Emmanuelle, et Céline Leclaire. 2022. « Vers l’intelligence artificielle et au-delà ! Une feuille de route pour la BnF ». Arabesques, nᵒ 107:8‑9. https://doi.org/10.35562/arabesques.3082.
      Bernardot, Marc. 2018. « Plongée dans les métaphores et représentations liquides de la société numérique ». Netcom. Réseaux, communication et territoires, nᵒ 32-1/2 (décembre):29‑60. https://doi.org/10.4000/netcom.2886.
      Bert-Erboul, Clément, Sylvie Fayet, et Louis Wiart, éd. 2022. À l’ombre des bibliothèques : Enquête sur les formes d’existence des bibliothèques en situation de fermeture sanitaire. La Numérique. Villeurbanne: Presses de l’enssib. https://doi.org/10.4000/books.pressesenssib.16389.
      Bertrand, Sophie, et Isabelle Degrange. 2021. « Gallica sur les réseaux sociaux numériques ou la réappropriation d’une mémoire collective ». Balisages. La revue de recherche de l’Enssib, nᵒ 2 (mars). https://doi.org/10.35562/balisages.450.
      Bertrand, Sophie, et Aline Girard. 2016. « Gallica (1997 – 2016) ». Bulletin des bibliothèques de France. https://bbf.enssib.fr/consulter/bbf-2016-09-0048-005.
      Blasselle, Bruno, et Gennaro Toscano, éd. 2021. Histoire de la Bibliothèque nationale de France. Paris: BnF éditions.
      BnF. 1990. « Rapport PLAO ». 2006/079/235. BnF.
      BnF. 2020. « Schéma numérique de la Bibliothèque nationale de France ». BnF. https://www.bnf.fr/sites/default/files/2020-11/bnf_Schema_numerique_2020_.pdf.
      BnF. 2021. « BnF Intelligence Artificielle. Feuille de route 2021-2026 ». Feuille de route. Bibliothèque nationale de France, Paris. https://www.bnf.fr/fr/lintelligence-artificielle-un-axe-strategique.
      Borgman, Christine L. 1999. « What are digital libraries? Competing visions ». Information Processing & Management 35 (3):227‑43. https://doi.org/10.1016/S0306-4573(98)00059-4.
      Borgman, Christine L. 2000. From Gutenberg to the Global Information Infrastructure: Access to Information in the Networked World. Cambridge, MA: The MIT Press. https://doi.org/10.7551/mitpress/3131.001.0001.
      Borgman, Christine L. 2007. Scholarship in the Digital Age: Information, Infrastructure, and the Internet. Cambridge, MA: The MIT Press. https://doi.org/10.7551/mitpress/7434.001.0001.
      Boullier, Dominique. 2016. Sociologie du numérique. Armand Colin. https://doi.org/10.3917/arco.boull.2016.01.
      Boullier, Dominique. 2025. « Sommet IA : la nécessaire sécession sémantique européenne - AOC media ». AOC media - Analyse Opinion Critique. https://aoc.media/analyse/2025/02/09/sommet-ia-la-necessaire-secession-semantique-europeenne/.
      Boullier, Dominique, et Franck Ghitalla. 2004. « Le Web ou l’utopie d’un espace documentaire ». Revue I3 - Information Interaction Intelligence 4 (1):173‑89.
      Da, Nan Z. 2019. « The Computational Case against Computational Literary Studies ». Critical Inquiry 45 (3):601‑39. https://doi.org/10.1086/702594.
      Da Sylva, Lyne. 2013. « Genèse et description des bibliothèques numériques ». Documentation et bibliothèques 59 (3):132‑45. https://doi.org/10.7202/1018843ar.
      Dalbin, Sylvie, Emmanuelle Bermès, Antoine Isaac, Romain Wenz, Yann Nicolas, Tayeb Merabti, Anila Angjeli, et al. 2011. « Approches documentaires : priorité aux contenus ». Documentaliste-Sciences de l’Information 48 (4):42-59 [version non-paginée]. https://doi.org/10.3917/docsi.484.0042.
      Desrosières, Alain. 2010. La politique des grands nombres. Paris: La Découverte.
      Drucker, Johanna. 2017. « Why Distant Reading Isn’t ». PMLA 132 (3):628‑35. https://www.jstor.org/stable/27037376.
      Dubourg Glatigny, Pascal, et Hélène Vérin, éd. 2008. Réduire en art : La technologie de la Renaissance aux Lumières. Hors collection. Paris: Éditions de la Maison des sciences de l’homme. https://books.openedition.org/editionsmsh/10126.
      Duhamel, Benjamin. 2014. « Les technologies du web sémantique et du record linkage au service de data.bnf.fr et du Linked Open Data culturel : étude sur les nouveaux paradigmes informationnels ». Other, Université Lille 3, UFR DECCID, département SID. https://memsic.ccsd.cnrs.fr/mem_01081739.
      Dumas Primbault, Simon. 2022. « Leibniz en Créateur. Un regard matériel sur sa machine à calculer ». Savoirs Matières à raisonner. https://savoirs.app/fr/articles/leibniz-en-createur.
      Dumas Primbault, Simon. 2023. « Naviguer dans les savoirs à l’ère numérique. Pour une ethnographie des pratiques informationnelles sur Gallica ». Études de communication 61 (2):61‑89. https://doi.org/10.4000/edc.16108.
      Dumas Primbault, Simon. 2025. « OpenEdition as a governed milieu: Towards an ecological understanding of open digital knowledge infrastructures ». In Politics of Open Infrastructure.
      Dumas Primbault, Simon. s. d.a. « The “ecosystem” of open science: Tracing the Evolution of Ecological Metaphors in Discourses on the Digital Transition of Research ».
      Dumas Primbault, Simon. s. d.b. « Venturing Into the Noise: Discoverability practices of open scholarly resources on a national digital library ».
      Dumas Primbault, Simon, et Paul Guhennec. s. d. « La fabrique de la liquidité des données. Plongements dans un milieu navigable et herméneutique(s) de l’espace latent ». Intelligibilité du numérique.
      Galloway, Alexander R., Eugene Thacker, et McKenzie Wark. 2022. Excommunication: Three Inquiries in Media and Mediation. Chicago ; London: University of Chicago Press.
      Gattégno, Jean. 1991. « La bibliothèque de France ». Bulletin des bibliothèques de France, nᵒ 5:393-403 [version non-paginée]. https://bbf.enssib.fr/consulter/bbf-1991-05-0393-002.
      Gavin, Michael. 2020. « Is there a text in my data? (Part 1): on counting words ». Journal of Cultural Analytics 5 (1). https://doi.org/10.22148/001c.11830.
      Illien, Gildas. 2016. « Transition bibliographique : la revanche des données ? » Archimag. https://www.archimag.com/bibliotheque-edition/2016/03/11/transition-bibliographique-revanche-donnees.
      Jacob, Christian. 1991. « Rapport de grand lecteur ». BnF. https://lieuxdesavoir.hypotheses.org/tag/lecture-assistee-par-ordinateur.
      Jeanneney, Jean-Noël. 2005. Quand Google défie l’Europe: Plaidoyer pour un sursaut. Paris: Mille et une nuits.
      Larrue, Jean-Marc, et Marcello Vitali-Rosati. 2019. Media Do Not Exist: Performativity and Mediating Conjunctures. Theory on Demand. Amsterdam: Hogeschool van Amsterdam, Lectoraat Netwerkcultuur. https://doi.org/10.25969/mediarep/19251.
      Le Marec, Joëlle. 2021. Essai sur la bibliothèque : Volonté de savoir et monde commun. Papiers. Villeurbanne: Presses de l’enssib. https://books.openedition.org/pressesenssib/15930.
      Leclaire, Céline. 2021. « Comment une carte vint au monde ». Balisages. La revue de recherche de l’Enssib, nᵒ 3 (novembre). https://doi.org/10.35562/balisages.622.
      Levoin, Xavier. 2021. « Data.bnf.fr : améliorer la découvrabilité des contenus culturels sur le web ». Archimag 341 (1):28‑29. https://doi.org/10.3917/arma.341.0028.
      Maignien, Yannick. 1995. « La bibliothèque virtuelle ou de l’Ars memoria à Xanadu ». Bulletin des bibliothèques de France, nᵒ 2:8‑17. https://bbf.enssib.fr/consulter/bbf-1995-02-0008-001.
      Mesguich, Véronique. 2023. Les bibliothèques face au monde des données. Papiers. Villeurbanne: Presses de l’enssib. https://books.openedition.org/pressesenssib/17655.
      Moretti, Franco. 2013. Distant Reading. London: Verso Books.
      Mounier, Pierre. 2018. Les humanités numériques : Une histoire critique. Interventions. Paris: Éditions de la Maison des sciences de l’homme. http://books.openedition.org/editionsmsh/12006.
      Mounier, Pierre, et Simon Dumas Primbault. 2023. « Sustaining Knowledge and Governing its Infrastructure in the Digital Age: An Integrated View ». Zenodo. https://doi.org/10.5281/zenodo.10036402.
      Pardé, Thierry, et Irène Bastard. 2020. « Les publics de la BnF - Synthèse de l’Observatoire 2020 ». Rapport d’enquête. BnF. https://www.bnf.fr/sites/default/files/2022-01/Les_publics_de_la_BnF_Synthese_de_l_observatoire_2020.pdf.
      Payen, Emmanuèle, éd. 2022. Exposer en bibliothèque : Enjeux, méthodes, diffusion. La Boîte à outils. Villeurbanne: Presses de l’enssib. https://books.openedition.org/pressesenssib/16337.
      Perriault, Isabelle. 1995. « Rencontre avec André Zysberg. PLAO nouveau : la lecture assistée par ordinateur revient sur terre ». Archimag 90:16.
      Poupeau, Gautier. 2024. « Le « lac de données », une infrastructure technique pour déployer la gouvernance des données à l’Ina ». In Les nouveaux paradigmes de l’archive, édité par Claire Scopsi, Clothilde Roullier, Martine Sin Blima-Barru, et Édouard Vasseur. Actes. Pierrefitte-sur-Seine: Publications des Archives nationales. https://doi.org/10.4000/books.pan.7253.
      Richard, Michel. 1993. « Le programme de numérisation de la Bibliothèque de France ». Bulletin des bibliothèques de France, nᵒ 3:53‑63. https://bbf.enssib.fr/consulter/bbf-1993-03-0053-007.
      Roquet, Nicolas. 2016. « De la bibliothèque comme monument public ». Argus 44 (3):22.
      Seaver, Nick. 2022. Computing Taste: Algorithms and the Makers of Music Recommendation. Chicago, IL: University of Chicago Press. https://press.uchicago.edu/ucp/books/book/chicago/C/bo183892298.html.
      Silva Neto, Victo José da, et Tulio Chiarini. 2023. « The Platformization of Science: Towards a Scientific Digital Platform Taxonomy ». Minerva 61 (1):1‑29. https://doi.org/10.1007/s11024-022-09477-6.
      Star, Susan Leigh. 2010. « Ceci n’est pas un objet-frontière !:Réflexions sur l’origine d’un concept ». Revue d’anthropologie des connaissances 41 (1):18‑35. https://doi.org/10.3917/rac.009.0018.
      Stiegler, Bernard. 1990. « Complément au rapport de grand lecteur ». 2006/079/235. BnF.
      Stiegler, Bernard. 1994. La Technique et le temps. 1. La Faute d’Epiméthée. Paris: Galilée.
      Virbel, Jacques. s. d. « Notes sur « Le projet de la station de travail de la bibliothèque de France » ». 2006/079/235. BnF.
      Wagneur, Jean-Didier. 2002. « Gallica : la bibliothèque électronique de la BnF : quel accès pour les personnes handicapées visuelles ? » In Bibliothèques et publics handicapés visuels. Paroles en réseau. Paris: Éditions de la Bibliothèque publique d’information. https://doi.org/10.4000/books.bibpompidou.1500.
      Zaslavsky, Floriane, et Irène Bastard. 2024. Tous les savoirs du monde ? La circulation du patrimoine à l’ère numérique. Lormont: Bord de l’eau.

      1. J’utilise ici la définition donnée en introduction de ce dossier, c’est-à-dire la « remédiation » comme ensemble des « opérations de traduction linguistique, formelle, matérielle d’une chose depuis un medium vers un autre (un genre vers un autre, un support vers un autre, un code vers un autre…) ».↩︎

      2. Soit environ 3,3 milliards d’euros en 2024 selon l’INSEE.↩︎

      3. Je remercie Emmanuelle Bermès de m’avoir fait remarquer ce détail important lors du processus d’évaluation.↩︎

      4. Je remercie Marie D. Martel et Fabienne Henryot de m’avoir souligné ceci lors du processus d’évaluation.↩︎

      5. Et des siennes propres à partir du changement d’échelle de 2006-2007.↩︎

      6. Pour Céline Leclaire, l’« acte fondateur » incarné par le schéma numérique 2020 « en évoque un autre, décrit par Maurizio Bettini [2020, p. 142] : “L’acte de mélanger [des] mottes de terre apportées de loin reflète le mélange des hommes venus de tous ces lieux différents que Romulus rassemble dans l’asylum au moment de fonder une nouvelle cité : en accueillant la terre provenant d’autres territoires, le sol du Latium devient de manière très concrète ‘terre d’asylum’. Comment va donc se configurer, dans la représentation mythique, le sol de la ville de Rome ? Comme à la fois un et multiple : un, parce que les mottes au départ distinctes sont ensuite mélangées ; multiple, parce qu’il tient ses origines d’autant de ‘sols’ différents que les mottes de terre. […] En décrivant le terrain de la fondation comme un mélange de terres disparates (parallèlement à une fusion entre hommes d’origines tout aussi disparates), ce mythe met en évidence l’un des caractères principaux de la culture romaine : l’ouverture”. À la fois un et multiple : telle est aussi une manière d’appréhender un numérique qu’il s’agit d’habiter collectivement. » (Leclaire 2021, 15)↩︎

      7. Une vertu cardinale des représentations spatiales dont l’anthropologue Nick Seaver a montré la puissance et les écueils pour la représentation des données. (Seaver 2022, chap. 5)↩︎

      8. Je remercie Marie D. Martel d’avoir porté mon attention sur cet aspect qui permet plus largement d’enrichir la discussion sur la notion de « remédiation » à travers tout ce dossier.↩︎

      Dumas Primbault Simon 0000-0002-0012-0550
      Dumas Primbault Simon 0000-0002-0012-0550
      Wormser Gérard 0000-0002-6651-1650
      Du Poste de Lecture Assistée par Ordinateur (P.L.A.O.) au schéma numérique
      Trois étapes de la re-médiation de la BnF
      Simon Dumas Primbault
      Département des littératures de langue française
      2104-3272
      Sens public 2025/10/03 La (re-)médiation des collections de la BnF et du Mucem. Les multiples matérialités des fonds documentaires et les pratiques qu’elles révèlent
      Regarding the transition from “library” to “digital library”, this essay aims to trace back the steps that led to the digitization and “datafication” of the collections held by the Bibliothèque nationale de France (BnF). The shift of a document from a physical to a digital form is herein considered as a larger operation of remediation, involving not only the document itself, but also deeply affecting the spaces, services and structure of the library as an institution. (SP)
      Considérant la transformation de la « bibliothèque » à la « bibliothèque numérique », cet article a pour objectif de retracer les étapes de la numérisation et « dataification » des collections de la Bibliothèque nationale de France (BnF). Le passage du document physique au numérique est ici entendu comme une opération de remédiation plus large, qui implique non seulement le document en lui-même, mais touche aussi profondément les espaces, les services et les organisations de la bibliothèque en tant qu’institution. (SP)
      bibliothèque http://www.eionet.europa.eu/gemet/concept/4793
      Métadonnées http://data.bnf.fr/ark:/12148/cb150598844
      Données massives http://data.bnf.fr/ark:/12148/cb16657853j
      Numérisation http://data.bnf.fr/ark:/12148/cb13324505k
      remédiation, bibliothèque numérique, numérisation, données, ordre du savoir
      remeditation, digital library, digitization, data, order of knowledge