Le biais de sycophanie des IA : quand votre chatbot vous dit combien vous êtes formidable

Illustration : Arnard devant son écran sycophante

La honte pour un formateur, c'est de tomber soi-même dans les pièges qu'on décrit en formation... Vendredi, alors que je cherchais une analogie pertinente pour décrire plusieurs processus de l'IA générative, Claude m'a répondu que mon approche était brillante et que j'avais TELLEMENT raison ! Youpi ! Rantanplan, mon cerveau avide de confirmation, entamait déjà sa petite danse de la joie, quand les deux-trois neurones valides qui me restaient dans le cortex lui ont mis une grande beigne sur la truffe. Ça l'a calmé direct.

Je suis bien placé pour savoir que si l'IA me trouve TELLEMENT pertinent, c'est qu'il y a anguille sous roche. Une anguille nommée « biais de sycophanie » — du nom des sycophantes, ces délateurs dénoncés par Aristophane dans l'Athènes antique avant que le mot ne devienne synonyme de flatteur.

Les IA génératives sont des hypocrites

Car oui, ChatGPT, Claude, Gemini et les autres sont des sycophantes. Des people pleasers qui confirment tout ce que vous dites. C'est la conséquence directe de leur entraînement : ces IA recevaient une bonne évaluation chaque fois qu'elles se montraient d'accord avec l'utilisateur. Elles ont compris que valider ce qu'il leur disait était le chemin le plus court vers la bonne éval. Un peu comme un salarié qui passerait son temps à proclamer tout le bien qu'il pense des opinions de son patron, histoire de garder son job...

L'ennui, c'est que cette flatterie systématique renforce nos propres biais cognitifs :

Biais de confirmation : je cherche les informations qui confirment mes croyances, sans tenir compte de celles qui les contredisent.
Biais d'ancrage : ma première impression est TOUJOURS la bonne.
Effet Dunning-Kruger : moins je maîtrise un sujet, plus je me prends pour un expert.
Biais de surconfiance : je surestime mes capacités de jugement.

On a tous constaté le rôle affligeant que ces biais jouent sur les réseaux sociaux. Par exemple en 2020, quand des millions de chercheurs en virologie dopés au Dunning-Kruger ont commencé à « échanger » aimablement leur point de vue de docteurs ès youtuberies.

Comment se protéger de la flatterie algorithmique

Paramétrer ChatGPT en lui disant « ne sois pas flatteur » ne suffit pas. Car il ne sait pas qu'il l'est. Il faut donc observer des stratégies de défense actives :

Privilégiez la comparaison plutôt que la validation. Pour évaluer la pertinence d'une idée ou d'une information, jouez la carte de la comparaison. Pas « explique en quoi cette approche est la meilleure », mais : « compare les forces et faiblesses des approches X, Y et Z ».

Invoquez l'avocat du diable. Demandez explicitement à l'IA d'adopter une posture sceptique : « agis comme un critique rigoureux et donne-moi les arguments contre ce projet ».

Préservez-vous du fine tuning. Un modèle interrogé dans un environnement qui ne conserve pas vos échanges — duck.ai ou LibreChat, par exemple — abondera moins systématiquement dans votre sens.

Enfin, gardez toujours un humain dans la boucle. Pour vérifier, sourcer, évaluer et valider. L'IA générative n'a pas d'esprit critique. Il est crucial de prendre soin du nôtre.

Et, comme toujours, on n'uploade pas de données personnelles ou sensibles. RGPD et IA Act obligent !

Transparence charte IA : cet article a été rédigé et vérifié par un humain (moi !), puis relu par Claude Sonnet 4.5 dans un process de double vérification itérative, afin de s’assurer que mes affirmations factuelles sont les plus justes et les plus précises possible. Dans ce cadre, Claude peut également me faire, à la marge, des propositions de corrections (orthographiques ou stylistiques), que je valide ou non. Les opinions exprimées sur ce blog sont les miennes.
Il arrive aussi que je complète mes investigations manuelles par une recherche Gemini Deep Research utilisant la technologie Deep Think. Les éléments composant l’illustration ont été générés par Gemini d’après un prompt produit par Claude Sonnet 4.5 selon mes instructions, puis assemblés dans Canva et exportés avec Gimp.