Testez microGPT, l’IA générative de poche d’Andrej Karpathy



MISE À JOUR

Le portage ci-dessous correspond précisément au code de Karpathy dont il est question plus bas. Mais après avoir publié cette page, je me suis permis d'adapter le microGPT : nouveau corpus de données, nouveaux paramètres. Tout est expliqué dans ce billet et la nouvelle interface de test est là.



Une intelligence artificielle générative complète qui tourne entièrement dans votre navigateur, vous y croyez ? Non, hein… C’est pourtant ce qu’Andrej Karpathy, ancien chercheur chez OpenAI et ex-Directeur IA chez Tesla a publié le 11 février 2026 ! En 243 lignes de code, il réduit l’algorithme complet d’un modèle GPT à sa substantifique moelle. Une belle « leçon de transparence radicale » selon le média Numérama.

Illustration : Arnard le renard découvre microGPT

Comment ça marche ? D’abord, sécurisez les données d’entraînement. Pour d’évidentes raisons d’échelle et de puissance, ce mini-moteur s’entraîne non sur des milliards de données issues du web, mais sur une liste de 32 000 prénoms réels : vérifiez si le vôtre s’y trouve ! Puis ajustez les paramètres et cliquez sur « Lancer l’entraînement ». Le modèle crée alors les vecteurs de ses 27 tokens (les 26 lettres de l’alphabet + un marqueur de début/fin de mot). Enfin, il est prêt à générer de nouveaux prénoms, exactement de la même manière que ChatGPT génère de nouvelles phrases : en utilisant la probabilité statistique qu’un token en suive un autre. Une fois que votre modèle est entraîné, vous pouvez cliquer plusieurs fois sur « Générer » pour vérifier qu’il invente de nouveaux prénoms à chaque fois.

Avec ce code, Karpathy prouve que l’IA, ce n’est pas de la magie noire. Seulement des mathématiques et de la puissance de calcul, comme je l’explique dans mes formations IA pour les asbl et le secteur non marchand.

Le portage en javascript a été réalisé avec Claude Opus 4.6 et Gemini Pro 3. Tout se déroule dans votre navigateur : pas de cookies, pas de tracking !

1. Données d'entraînement
Chargement...

Le modèle apprend en lisant des milliers de prénoms existants. Ajoutez le vôtre pour voir s'il parvient à s'en inspirer !

2. Configuration
300

C'est la durée de l'apprentissage. Comme à l'école, plus le modèle étudie longtemps, mieux il comprend la structure des mots. Trop peu ? Il babille.

16

La "richesse" du cerveau du modèle. 8 c'est décrire une pomme par sa couleur. 32 c'est ajouter la forme, le goût, la texture...

0.7

Rigueur vs Folie. À 0.1, le modèle est répétitif. À 1.0, il prend des risques créatifs. Au-delà, c'est le chaos total.

10

Le nombre de résultats produits après l'entraînement. Utile pour juger la créativité du modèle d'un seul coup d'œil.

3. Apprentissage & Résultats
En attente du démarrage... Courbe de "Loss" (Erreur) : plus elle descend, mieux c'est.
Étape -
Loss (Erreur) -
Paramètres -
Vocabulaire -

Prénoms générés par l'IA

● Inventés   ● Existants
Les résultats apparaîtront ici...
Système prêt.