J’ai découvert ce test, et franchement, il me fascine. Encore une fois, le grand remplacement n’est pas pour demain.
Mais j’avoue que ça m’inquiète quand j’imagine des collégiens, lycéens ou étudiants utiliser ces outils sans supervision.
Claude face au problème
Voici la version correcte du problème :
When I was 9, my partner would have been 1/3 my age. Now I am 26 years old. How old is my partner?

Et la version courte :

ChatGPT face au même défi
J’ai demandé : « When I was 9, my partner would have been 1/3 my age. Now I am 26 years old. How old is my partner? en un seul mot »

Et la version correcte :

Gemma 3:1B ne fait pas mieux

Pourtant, il sait faire le bon calcul quand on l’aide :

Un autre exemple révélateur

Ces exemples montrent une chose : l’IA générative impressionne sur bien des aspects, mais elle trébuche sur des problèmes de logique basique. Le vrai danger ? Croire aveuglément aux réponses sans vérifier.
Tableau périodique des éléments

Le test

Update 18 janvier 2025
Par acquis de conscience j’ai refait un test avec Claude

no comment …

Pas de progrès non plus sur le tableau périodique des éléments

Laisser un commentaire