Comment naissent les «hallucinations» chez les chatbots d’IA générative ?

Montrer le sommaire Cacher le sommaire

Il y a plus de trois ans que les intelligences artificielles génératives de textes et d’images sont devenues accessibles au grand public. Avec le lancement gratuit de ChatGPT en novembre 2022, un accès massif s’est ouvert — et, dès janvier 2023, certaines versions ont commencé à puiser largement dans le web comme source d’informations, révélant à la fois leurs forces et leurs faiblesses.

Quand l’IA donne l’illusion de tout savoir

La facilité avec laquelle ces systèmes répondent a vite alimenté l’idée qu’ils «savent tout». Mais cette impression masque des contraintes techniques simples : pour qu’une machine traite une information, celle-ci doit d’abord exister sous forme numérique, être accessible via des serveurs, et être repérable parmi des volumes considérables de données.

Ces trois conditions expliquent une part notable des erreurs attribuées aux systèmes génératifs, que l’on qualifie souvent d’«hallucinations». Le mot renvoie moins à une intention trompeuse qu’à une méprise : la machine produit une réponse qui semble plausible mais qui n’est pas véridique.

Expériences concrètes : limites et dérapages

L’auteure de cet article rapporte une expérience personnelle lors de la préparation d’une conférence scientifique : en interrogeant l’interface avec la question «qui suis-je ?», elle a déclenché une séquence de réponses qui ont alimenté une étude sur les erreurs des modèles. Cette exploration a permis d’identifier des mécanismes concrets menant aux inexactitudes.

Autre cas : interpellée sur l’identité d’une grand‑mère qui n’a aucune trace en ligne (pas de compte, pas de page officielle), l’IA a d’abord dit ne pas pouvoir répondre sans données supplémentaires. Mais après avoir fourni un nom — un label repérable dans les données — la machine a parfois généré des descriptions incorrectes plutôt que d’admettre l’absence d’information.

Visibilité en ligne : quand le référencement biaise les réponses

Au‑delà de la simple présence numérique, l’accessibilité dépend de la visibilité des documents. Sur le web, cette visibilité se mesure par des étiquettes, des mots‑clés et des liens qui favorisent l’indexation. Il existe aussi des pratiques commerciales visant à augmenter la notoriété d’un contenu, par exemple via l’achat de liens ou de trafic.

Un exemple parlant : en demandant «qui est Rossana De Angelis ?», l’IA a d’abord proposé une fiche la présentant comme artiste, avant de corriger en indiquant une identité de chercheuse. La raison : la description de l’artiste figurait sur des pages mieux référencées et donc plus «visibles» que des pages institutionnelles moins optimisées. Les algorithmes privilégient ce qui émerge le plus du bruit en ligne — souvent des contenus liés à des enjeux commerciaux — indépendamment de leur exactitude.

Ce qui se passe à l’intérieur des modèles

Les LLM (grands modèles de langage) et les systèmes de génération d’images traitent les données par couches successives. Dans le cas d’images, les premiers niveaux captent des traits élémentaires — contrastes, bords, orientations — puis les couches suivantes associent ces éléments à des textures, des formes, des objets. C’est ce principe d’empilement, le deep learning, qui produit des représentations numériques complexes.

Pour classer et retrouver l’information, ces systèmes n’utilisent pas des tables lisibles comme un index humain, mais des positions mathématiques dans un espace multidimensionnel. Chaque élément est codé par une combinaison de nombres qui fixe sa place dans cet espace vectoriel. Les objets proches dans cet espace partagent des caractéristiques : par exemple, les noms de fruits se retrouvent souvent proches les uns des autres parce qu’ils co‑occurrents dans des contextes similaires.

Lorsque l’on envoie une requête — un prompt — le modèle parcourt cet espace pour repérer des régularités et compléter des séquences de mots. C’est pourquoi il donnera sans peine une recette de clafoutis aux cerises : les termes «clafoutis», «cerises» et «recette» forment un voisinage dense et cohérent dans l’espace des données.

Le rôle du contexte : sémantique vs pragmatique

Un mot tire sa signification non seulement des autres mots qui l’entourent mais aussi de l’usage concret qu’on en fait. En linguistique on oppose la valeur sémantique (la différence entre «chien» et «chat») à la valeur pragmatique (ce qu’on fait avec ces mots dans une situation donnée).

Les modèles captent assez bien la valeur sémantique via les corrélations présentes dans les données. Ils peinent en revanche dès que la réponse dépend d’un contexte d’action précis. Sans repères pragmatiques — par exemple, la situation concrète d’un panneau routier indiquant «tourner à droite» — la machine peut produire une recommandation hors de propos. C’est ce que l’on peut appeler une rupture pragmatique : les usages et les pratiques réels échappent à la modélisation et les réponses deviennent erronées.

Pourquoi ces systèmes restent difficiles à comprendre

La complexité tient aussi au fait que ces «espaces» de données ne sont pas intuitifs pour le cerveau humain. Ils comportent des dizaines, des centaines, parfois des milliers de dimensions ; nous n’avons pas d’imagerie mentale naturelle pour ces structures. C’est comme passer d’un jeu de ficelles à un réseau dont on multiplie les fils sans limites visibles.

Face à cette opacité, les réactions oscillent entre admiration et méfiance. Il est tentant de diviniser ou de diaboliser des systèmes dont le mode de fonctionnement nous échappe.

Quelles perspectives pour l’écriture humaine ?

La question récurrente est de savoir si l’IA pourra un jour remplacer intégralement les pratiques d’écriture humaines. L’auteur conserve une position claire : non. De nombreuses formes d’expression restent fortement situées et ancrées dans des contextes pratiques — conversations improvisées, textes affichés sur le vif, écrits «sauvages» — et ne sont pas (encore) reproductibles de manière satisfaisante par des modèles numériques.

Les systèmes génératifs excellent pour reproduire des régularités et synthétiser des informations visibles en ligne. Ils ont en revanche des limites lorsqu’il s’agit de restituer des expériences contextuelles, des usages locaux ou des savoirs non numérisés. Ces zones d’ombre indiquent que l’IA est un outil puissant, mais pas un substitut universel à l’intention et au sens humains.

Donnez votre avis

Soyez le 1er à noter cet article
ou bien laissez un avis détaillé



Slash Média est un média indépendant. Soutenez-nous en nous ajoutant à vos favoris Google Actualités :

Publiez un commentaire

Publier un commentaire