🤖 Des poèmes prédits par l'ordinateur et des oiseaux en direct
Allison Parrish utilise les modèles apprenant et les études du langage pour générer des poèmes avec l'aide d'un ordinateur. Depuis un an, des amoureux des oiseaux les regardent devant leurs écrans.
🤖 Rencontre avec Allison Parrish
Essayez d’imaginer le dictionnaire non comme une compilation exhaustive des mots d’une même langue mais comme une simple sélection des mots « déjà vus » dans la nature. Ou alors, c’est de saison, comme des piquets qui bordent les routes, lorsqu’il a neigé : ce sont les seuls visibles, mais ils permettent d’appréhender l’environnement dissimulé. Le travail d’Allison Parrish consiste alors à faire émerger de nouveaux mots, à tracer de nouveaux chemins.
Poète et informaticienne, Allison utilise des techniques de machine learning pour produire de nouveaux mots. Par mail, elle explique que « les mots “artificiels” sont un exemple intéressant de symbolisme sonore : ces mots n’ont pas de définition dans le dictionnaire, donc nous n’avons pas d’autres choix que de les intepréter seulement à partir de la manière dont il résonne et la manière dont ils sont écrits ».
Allison a développé un modèle apprenant autour de la phonétique et de l’orthographe, « qui permet de prononcer des mots en fonction de leur orthographe, et d’écrire des mots en fonction de leur prononciation ». Ce modèle, poursuit-elle, conceptualise les mots comme des coordonnées dans l’espace et peut donc générer des mots à partir de coordonnées au hasard.
Pour son projet Compass, publié notamment dans la revue BOMB, la poètesse a donc cherché les coordonnées intermédiaires entre différents mots : « On considère que certains mots s’opposent deux-à-deux, et que d’autres désignent des catégories bien différentes ; ce modèle montre que ces mots ne sont en fait que des îles dans une mer d’orthographes et symbolismes sonores, où il n’y a pas de frontières fixes et où un mot déteint sur un autre. »
Récemment, sur Mastodon, où elle partage régulièrement son travail, Allison a publié vingt-six poèmes prédits par l’ordinateur, comme autant de lettres dans l’alphabet. « J’ai utilisé pour ce travail le modèle DistilGPT2, qui fonctionne un peu comme le correcteur automatique des smartphones et prédit les mots qui ont le plus de chance d’arriver ensuite, à partir des cinq mots précédents », explique-t-elle.
« Pour former une phrase, les stratégies les plus utilisées sont souvent de prendre le premier mot qui vient, ou un mot au hasard parmi ceux ayant la plus haute probabilité d’être le suivant. J’ai de mon côté écrit un bout de code qui augmentait légèrement la probabilité des mots contenant une certaine lettre…”
Le résultat, décliné sur tout l’alphabet propose une variation autour d’une même phrase, commençant par « The alphabet… » et s’adaptant à chaque lettre, grâce à des assonances et des allitérations générées par l’ordinateur, de manière subtile.
B / The alphabet is based on the number of bytes obtained by combining binary numbers between symbols.
C / The alphabet is such that creating consecutive convertions can constitute each comment in an instruction class.
…
L / The alphabet is usually simply followed by all letters which relate directly to Aristotle himself.
…
W / The alphabet is always written in this way when writing.
Ces textes sont générés par des modèles apprenants qui ont souvent besoin d’être nourris : ils ne prédisent une option qu’en fonction de tout ce qu’ils ont déjà ingurgité. Cela pose la question des corpus utilisés, et ce qu’on en fait, et Allison est revenue sur ce sujet il y a quelques mois, dans un long thread publié sur Twitter.
Les avancées autour des modèles de langages ressemblent à un vain concours, m’explique Allison par mail, où leurs créateur·ices vantent la taille de leurs corpus ou les capacités supposées du modèle. Elle nuance cependant : « Quelque soit la quantité de données à partir de laquelle un modèle de langage est entraîné, cela ne nous informe seulement de ce que le langage a été dans le passé et des utilisations de ce langage par les gens en particulier et les contextes linguistiques présents dans le corpus. »
« Les modèles de langage peuvent permettre de produire du langage poétique, mais seulement quand ils sont domptés par un·e poète·sse, dans le moment, pour une raison poétique particulière et dans le but de mettre une proposition particulière, pour un groupe de lecteur·ices particulier. » C’est la raison pour laquelle Allison préfère éviter d’utiliser de tels modèles, fonctionnant à partir de corpus inconnus.
« Tous les textes prennent source dans le travail, ajoute-t-elle par ailleurs, que ce soit celui de composer un texte, de le retranscrire, de le taper, etc. En général, je préfère travailler avec des bases de données pour lesquelles le travail a été compensé d’une manière ou d’une autre ou réalisé de manière bénévole, ou encore avec des textes qui sont des communs, que ce soit des textes dans le domaine public venus du Projet Gutenberg ou des textes en licence ouverte comme ceux venant de Wikipedia. »
Anna Ridler, dont nous vous avions parlé il y a quelques semaines - et dont quelques oeuvres sont exposées à l’Avant Galerie Vossen jusqu’en mars - n’a pas pris ce risque : elle a photographié elle-même 10 000 tulipes qui ont nourri ses algorithmes et produits différentes oeuvres. La constitution de la base de données photographique a duré trois mois.
Le travail d’Allison montre que les mots sont une matière vivante et flexible et qu’on peut y appliquer des concepts poétiques variés, et encore plus avec l’aide d’un ordinateur. Elle avait par exemple utilisé l’algorithme de compression utilisé pour les images jpg pour compresser les premiers versets de la Bible…
La première fois que j’ai vu Allison Parrish, c’était à l’occasion de la première Tech Zine Fair, à New York. Elle déclamait la Bible, compressée comme un jpg. J’ai été fasciné par sa détermination à lire : au bout du troisième passage de l’ordinateur sur la Genèse, on ne voyait qu’une suite de h, l et m. Et pourtant, Allison Parrish a tout lu sans hésiter, aussi clairement que possible. Et la poésie était là.
Pépites
Chaque semaine, je vous propose des pépites, souvenirs de temps passé sur internet ou documents originaux.
Nous vous parlions il y a deux semaines des travaux de recherche d’Adam Searle et Jonathon Turnbull, concernant les diffusions en direct d’interactions avec des animaux qui se sont mutlipliées à l’occasion des périodes de confinement. Un des exemples qu’ils ont donné ouvre des fenêtres sur le monde entier.
Le « Self-isolating Bird Club » rassemble des amoureux des oiseaux dans un groupe sur Facebook et à l’occasion d’un rendez-vous hebdomadaire sur Youtube. Il a été créé par un présentateur et une présentatrice de la BBC plutôt habitués aux contrées sauvages, obligés de rester chez eux.
Sur le groupe Facebook, qui compte 54 000 membre environ, ceux-ci sont invités à partager des photos et vidéos d’animaux sauvages – et d’animaux sauvages seulement : les photos d’animaux de compagnie ou de la ferme ne sont pas acceptées. Tous se réunissent une fois par semaine sur Youtube, autour de webcams disposées dans les jardins, à côté de mangeoires opportunément placées.
Chaque session démarre par un commentaire d’une caméra en direct, comme la « Live Royal Albatross Cam », installée en Nouvelle-Zélande, filmant un nid d’albatros. Des passages enregistrés, montrant les meilleurs moments du stream, sont également diffusés. On peut aussi voir le nid d’un pyrargue filmé depuis l’Australie.
Je ne peux m’empêcher de faire le parallèle avec Loft Story, qui proposait un flux en direct sur internet, et des quotidiennes chaque soir avec les meilleurs moments… Car sur certaines vidéos, on nous montre ce qu’on a pu rater, comme une attaque de faucon ou on nous annonce ce qu’on pourra voir en février : « Les œufs commencent à éclore en février, et les parents cessent alors de couver pour nourrir les nouveaux-nés. »
Au-delà de ces webcams « passives » se développent aussi des « pièges vidéos » qui enregistrent les passages d’animaux dans leur champ. Une plateforme propose aux internautes d’identifier les raisons de l’activation de la caméra, que ce soit le passage d’animaux sauvages ou le réglage de la caméra par un technicien… Un travail qui, en l’occurrence, n’est pas rendu invisible, mais intégré dans les options de la plateforme.
À voir
« Quelle était votre première performance en ligne ? » Alors que l’année 2020, et ses confinements ont consacré de nombreuses « premières » en ligne, trois artistes numériques, Annie Abrahams, Helen Varley Jamieson et Suzon Fuks, ont interrogé leurs pairs sur leurs débuts en ligne.
On remonte ainsi jusqu’en 1992 ; une trentaine d’artistes montrent leurs premières œuvres diffusées sur internet ou ailleurs. Histoire de remettre les choses en place.
On parle de nous
Vous l’avez compris, l’avenir de cette newsletter repose en grande partie sur vous. Plus vous la recommandez, partagez, critiquez, plus elle a de chances de continuer. Faites comme Alice Carnage (merci à elle) !