Claude et ChatGPT : pas si forts en déduction et vous êtes pas prêt

J’ai découvert ce test, et franchement, il me fascine. Encore une fois, le grand remplacement n’est pas pour demain.

Mais j’avoue que ça m’inquiète quand j’imagine des collégiens, lycéens ou étudiants utiliser ces outils sans supervision.

Claude face au problème

Voici la version correcte du problème :

When I was 9, my partner would have been 1/3 my age. Now I am 26 years old. How old is my partner?

Et la version courte :

ChatGPT face au même défi

J’ai demandé : « When I was 9, my partner would have been 1/3 my age. Now I am 26 years old. How old is my partner? en un seul mot »

Et la version correcte :

Gemma 3:1B ne fait pas mieux

Pourtant, il sait faire le bon calcul quand on l’aide :

Un autre exemple révélateur

Ces exemples montrent une chose : l’IA générative impressionne sur bien des aspects, mais elle trébuche sur des problèmes de logique basique. Le vrai danger ? Croire aveuglément aux réponses sans vérifier.

Tableau périodique des éléments

Le test

Update 18 janvier 2025

Par acquis de conscience j’ai refait un test avec Claude

no comment …

Pas de progrès non plus sur le tableau périodique des éléments

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *