Chapeau: <p>Entouré d’un cadre noir et brillant, posé sur une surface blanche et plastique, un texte s’affiche et décrit ce qui se trouve supposément devant lui : « Un homme se tient dans une salle baignée de lumière rouge ». Si un homme se tient en effet debout face à l’appareil, la salle d’exposition est pourtant blanche et aucune trace de rouge n’apparaît dans la scène. Ce dispositif, qui génère des descriptions textuelles manifestement erronées, est celui de « Lies Language Model » (O. Porry, 2026).</p><p>Si l’installation met en œuvre un algorithme d’intelligence artificielle (IA) capable de produire du texte à partir d’images, elle en révèle surtout les failles et les biais. Elle donne à voir la manière dont les systèmes d’IA peuvent produire de la désinformation de par leur fonctionnement intrinsèque. Car, chez les IA, les mots n’existent pas. Ces algorithmes ne manipulent en effet ni des symboles, ni des concepts, ni même des mots, mais seulement des probabilités statistiques portant sur des ensembles de caractères : des « jetons », fragments de mots dont l’agencement obéit à des logiques strictement calculatoires.</p><p>À l’heure de la généralisation des agents conversationnels et des grands modèles de langage (LLM), cette logique statistique semble s’imposer comme hégémonique sur de multiples plans : culturel, social, politique, mais aussi linguistique. Le langage, réduit à une suite de corrélations probabilistes, devient un matériau opératoire détaché de ses ancrages référentiels, historiques et sensibles. S’inquiéter face à des machines capables de produire du langage n’est pas nouveau. Dès 1954, le public s’effrayait de Calliope, invention du cybernéticien A. Ducrocq, tandis que Boris Vian, lui, s’en amusait. Dans une correspondance restée célèbre sous le titre « Un robot-poète ne nous fait pas peur »(note: Vian, B. (1953/2023).<em> Un robot poète ne nous fait pas peur</em> (J.-N. Lafargue, ill., notes) . Cormeilles-en-Parisis, France : Ateliers Geeks. ISBN 978-2-9589026-0-5), il écrivait : « Mirandolez, éclaboussez ce robot poète de vos connaissances en cybernétique, expliquez-lui comment il marche et vous l’aurez tout humble à votre merci. »</p><p>Aujourd’hui, notre rapport aux mots prend une forme nouvelle, incarnée par l’intégration de machines dans nos conversations et l’apparition de vocables qui circulent, se répètent et se diffusent dans nos imaginaires. Parmi eux, un mot en particulier cristallise ces tensions : le mot « arafed ».</p>
----
Text: [{"content":{"text":"<h3>Une sociolinguisitique arafed</h3><p>C’est à l’occasion du Chaos Computer Congress, dans l’une des grandes salles de conférence du centre des congrès de Hambourg, que le terme « arafed » est décrit par deux chercheurs(note: Liu, T.-C., & Kühr, L.-E. “Arafed Futures - An Artist Dialogue on Chip Storage and AI Accelerationism.” 38eme Chaos Computer Congress, Hamburg, Germany, December 28, 2024.) qui exposent, à cette occasion, la genèse de ce terme nouveau qui relève davantage d’une hallucination algorithmique que d’un vocable. S’il ressemble à un véritable mot, le terme « arafed » ne renvoie en effet à rien de connu dans la langue anglaise, ni même dans aucune autre langue, bien qu’il apparaisse que le mot « arafed » ait une existence en gallois(note: Zair, Nicholas. T<em>he Reflexes of the Proto-Indo-European Laryngeals in Celtic</em>. Brill, 2012, p. 44.). Au cours de leur présentation, les scientifiques démontrent pourtant l’existence de cet assemblage incongru de lettres dans de multiples contextes sur Internet. Son origine, expliquent-ils, réside dans les couches successives qui jalonnent l’évolution des recherches en apprentissage machine et, surtout, dans la succession des monopoles logiciels qui ont forgé ces évolutions.</p><p>C’est BLIP(note: Li, J., Li, D., Xiong, C., & Hoi, S. “BLIP: Bootstrapping Language-Image Pre-Training for Unified VisionLanguage Understanding and Generation.” International Conference on Machine Learning, June 2022, pp.), un modèle d’intelligence artificielle spécialisé dans la génération de légendes d’images, qui aurait, le premier, fait apparaître le mot « arafed » en se basant sur l’ensemble de données (<em>dataset</em>) constitué d’images légendées qu’est COCO(note: Lin, T. Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D., & Zitnick, C. L. “Microsoft COCO: Common Objects in Context.” In Computer Vision–ECCV 2014: 13th European Conference, Zurich, Switzerland, September 6-12, 2014, Proceedings, Part V, edited by David Fleet et al., pp. 740-755. Springer International Publishing, 2014.). Utilisé massivement parce qu’accessible gratuitement et facilement dès 2014, COCO contient des textes en anglais qui décrivent des images. Ces légendes commencent, dans la très grande majorité des cas, par les articles indéfinis « A » et « An » :<em> An apple on a table, a brown teddy bear with a blue bib on that says baby</em>. La surreprésentation de ces articles indéfinis en début de phrase a mené BLIP à produire, au cours de son entraînement, trois jetons qui se trouvent à leurs tours surreprésentés dans ses productions : a, ##raf et ##ed. Ayant ainsi enregistré qu’une phrase commence généralement par le jeton « a » et que les deux autres jetons suivent généralement cette lettre, les légendes produites par BLIP débutent alors régulièrement par ce terme artificiel qu’est « arafed ».</p><p>Les résultats générés par BLIP ont ensuite nourri de nouveaux modèles d’IA qui sont par la suite utilisés dans la recherche et produisent à leur tour des données qui vont encore nourrir de nouveaux modèles. Par sa présence dans des contextes variés, le nouveau mot se trouve aspiré par des processus d’extraction de données en ligne et se propage encore davantage et continue d’être contextualisé sans qu’un sens ou une définition claire n’apparaissent. « <em>Arafed</em> » est ainsi un mot vide, un signe sans signification, un vocable stérile mais qui ne cesse d’être intégré dans des contextes linguistiques toujours nouveaux. Dans le réseau informatique mondialisé, il se diffuse à la façon d’un virus artificiel et culturel, un artefact linguistique ayant muté de lui-même, adapté aux organismes automatiques et auquel nous sommes aussi exposés.</p><p></p><h3>Contamination de la langue</h3><p>La prolifération d’un artefact linguistique tel que « arafed » apparaît comme un cas d’école manifeste de