Le dépôt légal du web et des modos
Vladimir Tybin travaille à la BnF sur le dépôt légal du web, qui archive ce qui est produit sur le web Français depuis près de vingt ans. Lucie Ronfaut nous propose les témoignages de trois modos.
Rencontre avec Vladimir Tybin
Le dépot légal existe en France depuis 1537 : chaque publication doit être envoyée à la Bibliothèque nationale de France et construire ainsi un patrimoine de ce qui a été écrit en France. En 2006, ce dépôt légal a été étendu au web et mis en œuvre à partir de 2011.
Nous avions interrogé, il y a quelques semaines Sophie Gebeil, une chercheuse qui a fait de ces archives du web ainsi créees son premier matériau. Elle a proposé à la BnF un parcours guidé dans les archives du web, reprenant son travail, sur les mémoires de l’immigration maghrébine.
Il y a quelques semaines, nous nous sommes rendu à la Bibliothèque nationale de France, dans le bureau de Vladimir Tybin, responsable de ce dépôt légal, pour discuter de ces collectes. La discussion avec le responsable du dépôt légal du web est une discussion très technique. Et ce, pour une bonne raison : la collecte est neutre.
« Comme le dépôt légal a été pensé en terme d’exhaustivité, nous ne sommes pas censés préjuger du contenu, rappelle Vladimir Tybin. Nous collectons une partie du Bon Coin, des sites marchands, des sites promotionnels ou publicitaires, qui, a priori, n’auraient pas d’intérêt intellectuel particulier. Mais nous ne savons pas ce qui va intéresser des chercheurs, et surtout, nous n’avons pas, a priori, à nous poser la question. »
Le dépôt légal du web s'effectue principalement selon deux méthodes parallèles. D’un côté, une collecte large, qui va essayer de récupérer un nombre limité de pages sur tous les sites hébergés en France ou ayant un nom de domaine français (.fr, .paris, .bzh, etc.). De l’autre, des collectes ciblées, préparées par les différents départements de la BnF pour capter le web plus précisément. Attentats de novembre 2015, confinements en 2020, périodes électorales donnent lieu à leur collecte ciblée.
Il y a un côté « artisanal » dans la collecte, explique Vladimir, notamment pour les contenus récupérés sur les réseaux sociaux. « Les grands acteurs comme Facebook ou Google font tout pour prévenir la dissémination des données », explique-t-il avant de lister les obstacles à la collecte de tel ou tel contenu. Récemment, Facebook a par exemple désactivé quelques fonctionnalités pour prévenir les collectes, au risque d’ailleurs de limiter l’accès de son site aux personnes ayant des problèmes de vue.
« Nous sommes constamment en train de trouver des moyens de collecter de nouveaux objets qui seraient diffusés, produits, exposés grâce à des nouvelles technologies, en adaptant nos outils », explique le responsable du dépôt légal du web.
Les archives captées depuis 2002, plus quelques archives acquises auprès d’Internet Archive, sont consultables dans les locaux de la BnF, à Paris et dans des bibliothèques partenaires. Un navigateur émulé propose de retrouver les pages telles qu’elles étaient à l’époque, si tout va bien : « Même si le contenu a disparu, même si la technologie qui permettait de jouer ce contenu dans le web vivant a disparu, l’objectif est de recréer quasiment à l’identique l’expérience de navigation et de présentation du contenu. »
Pour l’instant, les portes d’entrée à la consultation sont peu nombreuses : à travers des parcours guidés, qui listent plusieurs sites de façon thématique ou en connaissant précisément l’url. « C’est une difficulté : lorsqu’on ne connaît pas l’url, on ne peut pas accéder à certains contenus. Mais nous sommes en train de trouver des moyens de savoir ce qu’il y a dans nos collections, s’enthousiasme Vladimir. Nous allons réussir à organiser ces collections, ça rend très excitant et stimulant la tâche ! »
L’histoire de… trois modos
Qui sont ceux qui nettoient derrière nous ? Et pourquoi le font-ils ? Lucie Ronfaut a rencontré deux modératrices et un modérateur pour deux épisodes du podcast Programme B, réalisés par Elisa Grenet. Il et elles évoquent la difficulté de leur travail, ses conséquences sur leur santé mentale et leurs objectifs…
Valérie travaille pour un sous-traitant qui modère les sites d’actualité depuis l’année 2000. Alexandre modère bénévolement le forum r/France. Enfin, Anaïs modère, contre rémunération, les comptes sur les réseaux sociaux de l’autrice Pauline Harmange, qui subit de nombreuses campagnes de cyberharcèlement.
« Toute la journée, on reçoit des flux de commentaires, qu’on modère », raconte Valérie, qui se retrouve face à l’ensemble des commentaires des clients de son entreprise au même endroit. Alexandre explique que r/France nécessite 500 actions de modération par jour et qu’il souhaite avant tout proposer un espace « sain pour discuter »… Anaïs expose pourquoi son travail est nécessaire, quand les plateformes manquent d’efficacité, ou de transparence. Valérie rappelle que modo n’est pas un métier très simple et surtout très mal considéré.
« Être contre la modération automatique à l’heure actuelle, ça veut dire que tu délègues les dégueulasseries postées en Occident à des hommes et des femmes venant de pays en voie de développement. Si on pouvait déléguer une partie de cette modération, au moins pour les photos, à une modération automatique, ça serait déjà pas mal. »
C’est ce que rappelait en 2019, dans Nichons-nous dans l’Internet (que vous pouvez encore vous procurer ici), la chercheuse américaine J.A. Estruth. Elle faisait un parallèle intéressant entre les modérateur·ices et les ouvriers historiques de la Silicon valley : « Il existe une continuité historique réelle entre les souffrances psychologiques des modérateurs de contenu professionnels et les souffrances physiques engendrées par l’utilisation de produits chimiques dans la fabrication des produits électroniques. »
Elle raconte comment les personnes œuvrant sur les circuits imprimés ont subi des séquelles importantes, de la même manière que les modérateur·ices qui filtrent le web :
« Les trois paramètres qui caractérisent la main-d’œuvre des usines de produits électroniques au plus fort du mouvement de contestation contre les produits chimiques se retrouvent dans le secteur de la modération de contenu : sous-traitance majeure, souffrances subies de manière disproportionnée par des personnes de couleur, et syndicalisme faible, voire inexistant. »
Sans oublier le bénévolat, puisque souvent, avant même toute réaction des plateformes, « Twitter et d’autres médias sociaux profitent également du travail réalisé par des community managers bénévoles qui cherchent à modérer la misogynie et le sexisme en ligne », ainsi que le rappelait la chercheuse Lisa Nakamura, citée par J.A. Estruth.
À écouter
Jeanne Mayer a récidivé. La réalisatrice et autrice d’une présentation sonore de Chip Chan, dont nous vous avions parlé il y a plusieurs mois, propose une nouvelle enquête audio aux côtés des ados qui « shiftent ». Une pratique de rêve éveillé, dans des univers fictionnels.
Plusieurs ados « shifteuses » racontent à Jeanne leur méthode, leurs expériences et ce qu’elles en tirent. Elles se racontent aussi en ligne, sur TikTok ou Wattpad.